Presentamos Scribe v2 Realtime

Publicado: 11 nov 2025

EscucharEscucha este artículo

0:00

0:000:00

Contacta con ventas

Más información

Scribe v2 Realtime: el modelo más preciso para transcripción en directo

Scribe v2 Realtime marca un nuevo estándar en baja latencia para Voz a Texto.

Pensado para casos de uso en directo—agentes de voz, asistentes en reuniones y subtitulado en tiempo real—transcribe voz en menos de 150 ms en inglés, francés, alemán, italiano, español, portugués y 90 idiomas más.

Scribe v2 Realtime está diseñado específicamente para casos de uso con agentes. En 500 muestras difíciles con ruido de fondo e información compleja, supera claramente a todos los demás modelos.

Características principales

Latencia negativa: predicción de la siguiente palabra y puntuación
Detección automática de idioma: habla en cualquier idioma y cambia de idioma durante la conversación
Condicionamiento de texto: Scribe v2 Realtime continúa la transcripción a partir del lote anterior, útil al reiniciar una conexión
Detección de actividad de voz (VAD)
Confirmación manual: control total sobre cuándo finalizar los segmentos de la transcripción
Varios formatos de audio: compatible con PCM (48kHz) y codificación μ-law
Listo para empresas con cumplimiento SOC 2, ISO 27001, PCI DSS L1, HIPAA y RGPD, opciones de residencia de datos en la UE e India y modo de retención cero para cargas sensibles

Scribe v2 Realtime ofrece comprensión a nivel humano en tiempo real, permitiendo conversaciones naturales y respuestas inmediatas en entornos en directo. Scribe v2 Realtime alcanza un 93,5% de precisión en 30 idiomas europeos y asiáticos de uso común.

Crea con la API

Scribe v2 Realtime ya está disponible a través de la API de ElevenLabs.

Consulta la documentación: https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Usa Scribe v2 Realtime en ElevenLabs Agents

Despliega agentes naturales y realistas impulsados por Scribe v2 Realtime. Crea asistentes de voz para soporte, ventas o experiencias dentro de productos que entienden y responden en tiempo real.

Descubre más: https://elevenlabs.io/agents