Quando o Scribe v2 Realtime será integrado à sua Plataforma de Agentes?

O Scribe v2 Realtime está integrado à plataforma de agentes como uma opção, ainda não será o modelo padrão.

Qual é o limite de concorrência para o Scribe v2 Realtime?

Será 30+ para clientes empresariais. Semelhante ao Turbo/Flash TTS.

Vocês oferecem diarização de falantes?

Alguns provedores que oferecem diarização de falantes em tempo real, como Deepgram, têm grandes problemas em idiomas que não são o inglês. Isso não é uma prioridade no momento para um modelo em tempo real.

Vamos suportar canais duplos com o Scribe v2 Realtime?

Não, suporte a canais duplos não está planejado.

Pular para o conteúdo

Entrar Inscreva-se

Transcrição de Fala em Tempo Real — copy

Transcreva fala ao vivo instantaneamente

Scribe v2 Realtime é o modelo de transcrição em tempo real mais preciso, com latência de 150ms em mais de 90 idiomas. Disponível via API.

Comece a transcrever Explore a documentação

Apresentando o Scribe v2 Realtime, feito para velocidade e precisão

Ultra-rápido, ultra-preciso e feito para fala ao vivo. Scribe v2 Realtime oferece transcrição instantânea para agentes, reuniões e IA conversacional.

Alta Precisão

Treinado em dados globais diversos e ajustado para fala natural, o Scribe alcança as melhores taxas de erro de palavras do setor em idiomas e sotaques principais.

Latência Ultra-baixa

Transmita áudio e receba transcrições em ~150 ms, permitindo compreensão em tempo real para agentes ao vivo, reuniões e IA conversacional.

Fala em tempo real para agentes, apps e todos os idiomas

Live call

I’m

happy

help.

What’s

your

address?

It’s

john.doe@me.com

Thanks.

And

your

phone

number?

1-800-404

Feito para Agentes e aplicativos de voz

Scribe v2 Realtime é feito para desenvolvedores que criam agentes conversacionais, assistentes de reunião e aplicativos de voz onde velocidade e precisão são críticas.

Japanese

Hindi

Polish

Swedish

Mandarin

Vietnamese

French

Capture fala com precisão em 90 idiomas

Scribe v2 Realtime garante compreensão consistente em todos os lugares, oferecendo precisão excepcional em 90 idiomas, lidando com diversos sotaques, dialetos e condições acústicas com facilidade.

Vários formatos de áudio

Suporta codificação PCM (8–48 kHz) e μ-law para compatibilidade em configurações de telefonia, navegador e estúdio.

Detecção de Atividade de Voz

Detecta quando a fala começa e termina, segmentando o áudio com precisão para transcrição em tempo real suave e eficiente.

Controle de Compromisso Manual

Dá aos desenvolvedores controle sobre quando finalizar transcrições – ideal para streaming personalizado e precisão ajustada.

Reconhecimento de fala projetado para desempenho em tempo real

Construído em uma nova geração de modelos

Construído sobre a base do Scribe v2, o Scribe v2 Realtime oferece latência de ~150 ms com precisão inovadora em sotaques, tons e ambientes.

Scribe

makes

uses

has

new

Transcrição preditiva para baixa latência

Scribe v2 Realtime usa transcrição preditiva para antecipar as próximas palavras e pontuações mais prováveis – permitindo precisão em tempo real.

Vocabulário complexo

Suporte embutido para vocabulário complexo, incluindo linguagem técnica, medicamentos e nomes próprios.

Suporte a streaming

Envie áudio em pedaços contínuos e receba transcrições ao vivo instantaneamente – sem buffering, apenas compreensão em tempo real.

Condicionamento de texto

Scribe v2 Realtime continua a transcrição sem interrupções, mesmo quando a conexão é reiniciada.

Segurança e infraestrutura de nível empresarial em escala

Precisão incomparável, mesmo nos ambientes mais complexos

Natural Speech

Filler words, pauses and emotional cues

Low-quality audio

Background noise or low-bandwidth audio

Accents

Diverse accents and pronunciations

Domain terms

Acronyms, brands, financial or medical terms

Feito para todo fluxo de trabalho, de agentes à produção

Agentes ElevenLabs

Potencialize interações de voz em tempo real e IA conversacional com transcrição instantânea e de baixa latência. Scribe v2 Realtime permite que agentes ouçam, entendam e respondam mais rápido do que nunca.

Criar agente Explore a documentação

Scribe Realtime API

Integre o Speech-to-Text ultra-rápido diretamente no seu produto com uma simples WebSocket ou REST API. Transmita áudio conforme acontece e receba texto preciso em menos de 100 ms.

Explore a documentação

Preços flexíveis baseados nas suas necessidades

Experimente a melhor precisão e capacidade de resposta com preços projetados para escalar de startups a equipes empresariais.

$0.28 por hora ou menos

em planos de Negócios anuais

Explore a documentação

Perguntas frequentes

O que queremos evitar são picos de tráfego. Por exemplo, se um cliente passa de 10 solicitações para 100 de repente, é difícil para nossos sistemas. No entanto, se eles tiverem consistentemente 500 solicitações, com variação lenta, podemos planejar adequadamente e apoiar seu caso de uso. Observe que isso seria apenas para tamanhos de negócios significativos. Por favor, use #help-deal-desk para discutir negócios específicos.