Presentamos Scribe v2
- Publicado
EscucharEscucha este artículo
Scribe v2 está diseñado para transcripción por lotes, subtitulado y creación de subtítulos a gran escala. Mejora la estabilidad y precisión de Scribe v1, manejando mejor el audio de larga duración, pausas, cambios de tono y silencios prolongados.

Aunque Scribe v2 Realtime está optimizado para una latencia ultrabaja y casos de uso de
Scribe v2 logra la tasa de error de palabras más baja registrada en los estándares de referencia de la industria.

Keyterm Prompting para transcripción con contexto
Keyterm prompting va más allá del Vocabulario Personalizado estándar al usar el contexto de la transcripción. Selecciona hasta 100 palabras o frases, y Scribe v2 decidirá con precisión cuándo transcribir esos términos. Esto lo hace ideal para dominios técnicos, nombres de marcas y lenguaje específico de la industria.

Detección de entidades integrada con marcas de tiempo precisas
Scribe v2 incluye detección de entidades nativa para análisis de audio estructurado.
Puedes seleccionar hasta 56 categorías entre Información Personal Identificable, datos de salud o detalles de pago. Scribe v2 detectará automáticamente estas instancias y sus marcas de tiempo exactas en tu transcripción, facilitando la revisión, redacción o procesamiento de información sensible a gran escala.
Descubre más en la documentación de la API: https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection
Transcripción automática multilingüe
Scribe v2 soporta flujos de trabajo multilingües inteligentes desde el primer momento.
Puedes enviar audio que contenga múltiples idiomas en un solo archivo. El modelo detecta automáticamente cada idioma y lo transcribe correctamente sin segmentación o configuración manual.
Características adicionales para flujos de trabajo de producción
Scribe v2 incluye un conjunto de características diseñadas para casos de uso empresarial y de desarrolladores:
- Diarización de hablantes inteligente para etiquetado claro e intuitivo de hablantes
- Marcas de tiempo precisas a nivel de palabra para una alineación precisa de subtítulos y experiencias interactivas
- Etiquetado de audio dinámico que detecta eventos no verbales como risas o pasos
- Preparación empresarial con cumplimiento de SOC 2, ISO 27001, PCI DSS L1, HIPAA y RGPD, residencia de datos en la UE e India, y soporte de modo sin retención
Scribe v2, ahora en ElevenLabs Studio
Scribe v2 se utiliza ahora en ElevenLabs Studio para subtítulos, captions y transcripciones más precisas, apoyando a equipos que gestionan grandes bibliotecas de audio y video en marketing, medios, investigación, formación y casos de uso de cumplimiento normativo.

Pruébalo ahora: https://elevenlabs.io/app/studio
Construye con la API
Con Scribe v2, desarrolladores y empresas pueden automatizar flujos de audio complejos, mejorar la precisión en flujos de contenido globales y escalar de manera segura con pleno cumplimiento y controles de residencia de datos.

Scribe v2 está disponible hoy a través de nuestra API y plataforma Creativa.
Pruébalo ahora: https://elevenlabs.io/app/speech-to-text
Lee la documentación: https://elevenlabs.io/docs/capabilities/speech-to-text
Regístrate aquí: https://elevenlabs.io/speech-to-text




