Presentamos Scribe v2

Hoy presentamos Scribe v2: el modelo de transcripción más preciso jamás lanzado, con soporte para más de 90 idiomas.

Introducing Scribe v2

Scribe v2 está diseñado para transcripción por lotes, subtitulado y creación de subtítulos a gran escala. Mejora la estabilidad y precisión de Scribe v1, manejando mejor el audio de larga duración, pausas, cambios de tono y silencios prolongados.

Introducing Scribe v2

Mientras que Scribe v2 Realtime está optimizado para casos de uso de baja latencia y agentes, Scribe v2 está optimizado para grabaciones largas y complejas, manteniendo la precisión en diversos hablantes, acentos y estilos de entonación. El resultado son transcripciones consistentemente fiables en una amplia gama de condiciones de audio del mundo real.


Scribe v2 logra la tasa de error de palabras más baja registrada en los estándares de referencia de la industria.

Scribe v2 FLEURS benchmark

Keyterm Prompting para transcripción con contexto

Keyterm prompting va más allá del Vocabulario Personalizado estándar al usar el contexto de la transcripción. Selecciona hasta 100 palabras o frases, y Scribe v2 decidirá con precisión cuándo transcribir esos términos. Esto lo hace ideal para dominios técnicos, nombres de marcas y lenguaje específico de la industria.

Scribe v2 keyterm prompting

Detección de entidades integrada con marcas de tiempo precisas

Scribe v2 incluye detección de entidades nativa para análisis de audio estructurado.

Puedes seleccionar hasta 56 categorías entre Información Personal Identificable, datos de salud o detalles de pago. Scribe v2 detectará automáticamente estas instancias y sus marcas de tiempo exactas en tu transcripción, facilitando la revisión, redacción o procesamiento de información sensible a gran escala.

Descubre más en la documentación de la API: https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection

Transcripción automática multilingüe

Scribe v2 soporta flujos de trabajo multilingües inteligentes desde el primer momento.

Puedes enviar audio que contenga múltiples idiomas en un solo archivo. El modelo detecta automáticamente cada idioma y lo transcribe correctamente sin segmentación o configuración manual.

Características adicionales para flujos de trabajo de producción

Scribe v2 incluye un conjunto de características diseñadas para casos de uso empresarial y de desarrolladores:

  • Diarización de hablantes inteligente para etiquetado claro e intuitivo de hablantes
  • Marcas de tiempo precisas a nivel de palabra para una alineación precisa de subtítulos y experiencias interactivas
  • Etiquetado de audio dinámico que detecta eventos no verbales como risas o pasos
  • Preparación empresarial con cumplimiento de SOC 2, ISO 27001, PCI DSS L1, HIPAA y RGPD, residencia de datos en la UE e India, y soporte de modo sin retención

Scribe v2, ahora en ElevenLabs Studio

Scribe v2 se utiliza ahora en ElevenLabs Studio para subtítulos, captions y transcripciones más precisas, apoyando a equipos que gestionan grandes bibliotecas de audio y video en marketing, medios, investigación, formación y casos de uso de cumplimiento normativo.

Scribe v2 in Studio

Pruébalo ahora: https://elevenlabs.io/app/studio

Construye con la API

Con Scribe v2, desarrolladores y empresas pueden automatizar flujos de audio complejos, mejorar la precisión en flujos de contenido globales y escalar de manera segura con pleno cumplimiento y controles de residencia de datos.

Scribe v2 Keyterm prompting code snippet

Scribe v2 está disponible hoy a través de nuestra API y plataforma Creativa.

Pruébalo ahora: https://elevenlabs.io/app/speech-to-text

Lee la documentación: https://elevenlabs.io/docs/capabilities/speech-to-text

Regístrate aquí: https://elevenlabs.io/speech-to-text

Descubre artículos del equipo de ElevenLabs

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión