
Eleven Music: new tools for exploring, editing and producing music with AI
Transcripción de Voz en Tiempo Real
Scribe v2 Realtime es el modelo de transcripción en tiempo real más preciso con 150ms de latencia en más de 90 idiomas. Disponible a través de API.
Ultra-rápido, ultra-preciso y diseñado para discurso en vivo. Scribe v2 Realtime ofrece transcripción instantánea para agentes, reuniones e IA conversacional.
Entrenado con datos globales diversos y ajustado para el habla natural, Scribe logra las mejores tasas de error de palabras en la industria en los principales idiomas y acentos.
Transmite audio y recibe transcripciones en ~150 ms, permitiendo comprensión en tiempo real para agentes en vivo, reuniones e IA conversacional.

Scribe v2 Realtime está diseñado para desarrolladores que crean agentes conversacionales, asistentes de reuniones y aplicaciones de voz donde la velocidad y la precisión son críticas.
Scribe v2 Realtime asegura una comprensión consistente en todas partes, ofreciendo una precisión excepcional en 90 idiomas, manejando diversos acentos, dialectos y condiciones acústicas con facilidad.
Soporta codificación PCM (8–48 kHz) y μ-law para compatibilidad en configuraciones de telefonía, navegador y estudio.
Detecta cuándo comienza y termina el discurso, segmentando el audio con precisión para una transcripción en tiempo real fluida y eficiente.
Ofrece a los desarrolladores control sobre cuándo finalizar las transcripciones, ideal para transmisión personalizada y precisión ajustada.





Basado en los cimientos de Scribe v1, Scribe v2 Realtime ofrece una latencia de ~150 ms con una precisión revolucionaria en acentos, tonos y entornos.
Scribe v2 Realtime utiliza transcripción predictiva para anticipar las palabras y puntuaciones más probables, permitiendo una precisión en tiempo real.
Soporte integrado para vocabulario complejo, incluyendo lenguaje técnico, medicamentos y nombres propios.
Envía audio en fragmentos continuos y recibe transcripciones en vivo al instante, sin almacenamiento en búfer, solo comprensión en tiempo real.
Scribe v2 Realtime continúa la transcripción sin interrupciones, incluso cuando se restablece la conexión.

Natural Speech
Filler words, pauses and emotional cues

Low-quality audio
Background noise or low-bandwidth audio

Accents
Diverse accents and pronunciations

Domain terms
Acronyms, brands, financial or medical terms
Potencia interacciones de voz en tiempo real e IA conversacional con transcripción instantánea y de baja latencia. Scribe v2 Realtime permite a los agentes escuchar, entender y responder más rápido que nunca.

Integra Texto a Voz ultra-rápido directamente en tu producto con una simple API WebSocket o REST. Transmite audio en tiempo real y recibe texto preciso en menos de 100 ms.

Experimenta precisión y capacidad de respuesta de primera clase con precios diseñados para escalar desde startups hasta equipos empresariales.
$0.28 por hora o menos
en planes de Negocios anuales

Desarrollado por ElevenLabs Agentes