
Eleven Music: novas ferramentas para explorar, editar e produzir música com IA
Transcrição de Fala em Tempo Real
Scribe v2 Realtime é o modelo de transcrição em tempo real mais preciso, com latência de 150ms em mais de 90 idiomas. Disponível via API.
Ultra-rápido, ultra-preciso e feito para fala ao vivo. Scribe v2 Realtime oferece transcrição instantânea para agentes, reuniões e IA conversacional.
Treinado em dados globais diversos e ajustado para fala natural, o Scribe alcança as melhores taxas de erro de palavras do setor em idiomas e sotaques principais.
Transmita áudio e receba transcrições em ~150 ms, permitindo compreensão em tempo real para agentes ao vivo, reuniões e IA conversacional.

Scribe v2 Realtime é feito para desenvolvedores que criam agentes conversacionais, assistentes de reunião e aplicativos de voz onde velocidade e precisão são críticas.
Scribe v2 Realtime garante compreensão consistente em todos os lugares, oferecendo precisão excepcional em 90 idiomas, lidando com diversos sotaques, dialetos e condições acústicas com facilidade.
Suporta codificação PCM (8–48 kHz) e μ-law para compatibilidade em configurações de telefonia, navegador e estúdio.
Detecta quando a fala começa e termina, segmentando o áudio com precisão para transcrição em tempo real suave e eficiente.
Dá aos desenvolvedores controle sobre quando finalizar transcrições – ideal para streaming personalizado e precisão ajustada.





Construído sobre a base do Scribe v2, o Scribe v2 Realtime oferece latência de ~150 ms com precisão inovadora em sotaques, tons e ambientes.
Scribe v2 Realtime usa transcrição preditiva para antecipar as próximas palavras e pontuações mais prováveis – permitindo precisão em tempo real.
Suporte embutido para vocabulário complexo, incluindo linguagem técnica, medicamentos e nomes próprios.
Envie áudio em pedaços contínuos e receba transcrições ao vivo instantaneamente – sem buffering, apenas compreensão em tempo real.
Scribe v2 Realtime continua a transcrição sem interrupções, mesmo quando a conexão é reiniciada.

Natural Speech
Filler words, pauses and emotional cues

Low-quality audio
Background noise or low-bandwidth audio

Accents
Diverse accents and pronunciations

Domain terms
Acronyms, brands, financial or medical terms
Potencialize interações de voz em tempo real e IA conversacional com transcrição instantânea e de baixa latência. Scribe v2 Realtime permite que agentes ouçam, entendam e respondam mais rápido do que nunca.

Integre o Speech-to-Text ultra-rápido diretamente no seu produto com uma simples WebSocket ou REST API. Transmita áudio conforme acontece e receba texto preciso em menos de 100 ms.

Experimente a melhor precisão e capacidade de resposta com preços projetados para escalar de startups a equipes empresariais.
$0.28 por hora ou menos
em planos de Negócios anuais

Desenvolvido por ElevenLabs Agentes