Presentamos Scribe v2

Publicado: 9 ene 2026

EscucharEscucha este artículo

0:00

0:000:00

Scribe v2 está diseñado para transcripción por lotes, subtitulado y creación de subtítulos a gran escala. Mejora la estabilidad y precisión de Scribe v1, manejando mejor el audio de larga duración, pausas, cambios de tono y silencios prolongados.

Aunque Scribe v2 Realtime está optimizado para una latencia ultrabaja y casos de uso de

Scribe v2 logra la tasa de error de palabras más baja registrada en los estándares de referencia de la industria.

Keyterm Prompting para transcripción con contexto

Keyterm prompting va más allá del Vocabulario Personalizado estándar al usar el contexto de la transcripción. Selecciona hasta 100 palabras o frases, y Scribe v2 decidirá con precisión cuándo transcribir esos términos. Esto lo hace ideal para dominios técnicos, nombres de marcas y lenguaje específico de la industria.

Detección de entidades integrada con marcas de tiempo precisas

Scribe v2 incluye detección de entidades nativa para análisis de audio estructurado.

Puedes seleccionar hasta 56 categorías entre Información Personal Identificable, datos de salud o detalles de pago. Scribe v2 detectará automáticamente estas instancias y sus marcas de tiempo exactas en tu transcripción, facilitando la revisión, redacción o procesamiento de información sensible a gran escala.

Descubre más en la documentación de la API: https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection

Transcripción automática multilingüe

Scribe v2 soporta flujos de trabajo multilingües inteligentes desde el primer momento.

Puedes enviar audio que contenga múltiples idiomas en un solo archivo. El modelo detecta automáticamente cada idioma y lo transcribe correctamente sin segmentación o configuración manual.

Características adicionales para flujos de trabajo de producción

Scribe v2 incluye un conjunto de características diseñadas para casos de uso empresarial y de desarrolladores:

Diarización de hablantes inteligente para etiquetado claro e intuitivo de hablantes
Marcas de tiempo precisas a nivel de palabra para una alineación precisa de subtítulos y experiencias interactivas
Etiquetado de audio dinámico que detecta eventos no verbales como risas o pasos
Preparación empresarial con cumplimiento de SOC 2, ISO 27001, PCI DSS L1, HIPAA y RGPD, residencia de datos en la UE e India, y soporte de modo sin retención

Scribe v2, ahora en ElevenLabs Studio

Scribe v2 se utiliza ahora en ElevenLabs Studio para subtítulos, captions y transcripciones más precisas, apoyando a equipos que gestionan grandes bibliotecas de audio y video en marketing, medios, investigación, formación y casos de uso de cumplimiento normativo.

Pruébalo ahora: https://elevenlabs.io/app/studio

Construye con la API

Con Scribe v2, desarrolladores y empresas pueden automatizar flujos de audio complejos, mejorar la precisión en flujos de contenido globales y escalar de manera segura con pleno cumplimiento y controles de residencia de datos.