El sistema de transcripción en tiempo real más rápido y preciso
Diseñado para potenciar sistemas conversacionales donde cada milisegundo cuenta, Scribe Realtime v2 combina velocidad, precisión y cobertura multilingüe para habilitar la próxima generación de experiencias en vivo centradas en la voz.
Diseñado para voz en vivo
Los desarrolladores pueden transmitir audio directamente a la API o acceder a través de ElevenLabs Agents para una integración rápida en flujos de trabajo de voz y agentes.
[Insertar demostración en video: mostrar latencia y precisión de transcripción]
- Negative latency: Next word and punctuation prediction
- Automatic language detection: Speak in any language, switch language mid conversation
- Text conditioning: Scribe v2 Realtime continues the transcription based on the previous batch, useful when restarting a connection
- Voice Activity Detection (VAD)
- Manual commit: Full control over when to finalize transcript segments
- Multiple audio formats: Support for PCM (48kHz) and μ-law encoding
- Enterprise ready with SOC 2, ISO 27001, PCI DSS L1, HIPAA, and GDPR compliance, EU and India data residency options and Zero retention mode for sensitive workloads
Baja latencia
Transcribe en menos de <XX ms de voz a texto.
Alta precisión
Supera a todos los principales sistemas ASR en streaming, estableciendo nuevos estándares para el rendimiento en tiempo real. Construido sobre una arquitectura completamente nueva, extiende la precisión introducida por primera vez con Scribe v1.https://elevenlabs.io/docs/cookbooks/speech-to-text/streaming
Soporte multilingüe escalable
Scribe Realtime v2 admite 92 idiomas, incluidos dialectos regionales, ampliando la accesibilidad para aplicaciones globales.
Características para desarrolladoreshttps://elevenlabs.io/agents
[Insertar cuadrícula de características o diagrama de arquitectura]
Integración y disponibilidad
Scribe Realtime v2 está disponible hoy a través de la API de ElevenLabs y en ElevenLabs Agents. Los desarrolladores pueden comenzar a transmitir audio en vivo y recibir transcripciones en tiempo real usando una conexión WebSocket simple.https://elevenlabs.io/app/sign-up