Scribe Realtime v2 establece un nuevo estándar para Texto a Voz en vivo

Today we’re introducing Scribe v2 Realtime, the most accurate low-latency Speech to Text model, delivering live transcription in under 150 ms.

Scribe v2 Realtime

El sistema de transcripción en tiempo real más rápido y preciso

Diseñado para potenciar sistemas conversacionales donde cada milisegundo cuenta, Scribe Realtime v2 combina velocidad, precisión y cobertura multilingüe para habilitar la próxima generación de experiencias en vivo centradas en la voz.

Diseñado para voz en vivo

Scribe v2 Realtime benchmark

Los desarrolladores pueden transmitir audio directamente a la API o acceder a través de ElevenLabs Agents para una integración rápida en flujos de trabajo de voz y agentes.

[Insertar demostración en video: mostrar latencia y precisión de transcripción]

  • Negative latency: Next word and punctuation prediction
  • Automatic language detection: Speak in any language, switch language mid conversation
  • Text conditioning: Scribe v2 Realtime continues the transcription based on the previous batch, useful when restarting a connection
  • Voice Activity Detection (VAD)
  • Manual commit: Full control over when to finalize transcript segments
  • Multiple audio formats: Support for PCM (48kHz) and  μ-law encoding
  • Enterprise ready with SOC 2, ISO 27001, PCI DSS L1, HIPAA, and GDPR compliance, EU and India data residency options and Zero retention mode for sensitive workloads

Baja latencia

Transcribe en menos de <XX ms de voz a texto.

Alta precisión

Supera a todos los principales sistemas ASR en streaming, estableciendo nuevos estándares para el rendimiento en tiempo real. Construido sobre una arquitectura completamente nueva, extiende la precisión introducida por primera vez con Scribe v1.https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming

Scribe v2 Realtime API

Soporte multilingüe escalable

Scribe Realtime v2 admite 92 idiomas, incluidos dialectos regionales, ampliando la accesibilidad para aplicaciones globales.

Características para desarrolladoreshttps://elevenlabs.io/agents

Scribe v2 Realtime for Agents

[Insertar cuadrícula de características o diagrama de arquitectura]

Integración y disponibilidad

Scribe Realtime v2 está disponible hoy a través de la API de ElevenLabs y en ElevenLabs Agents. Los desarrolladores pueden comenzar a transmitir audio en vivo y recibir transcripciones en tiempo real usando una conexión WebSocket simple.https://elevenlabs.io/app/sign-up

Descubre artículos del equipo de ElevenLabs

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión