.webp&w=3840&q=80)
Creando Vibe Draw: combinando ElevenLabs con FLUX Kontext para crear imágenes con voz
- Categoría
- Desarrollador
- Fecha
Presentamos redacción de entidades integrada, mejor transcripción Indic-Inglés, un nuevo modo No Verbatim y ampliación de keyterm prompting hasta 1.000 términos.
Estas mejoras dan a desarrolladores más control sobre privacidad, precisión multilingüe, calidad de las transcripciones y exactitud en terminología específica.
Ahora Scribe v2 puede detectar y eliminar automáticamente entidades sensibles de las transcripciones, como nombres, números de tarjeta de crédito, números de la Seguridad Social y otros datos personales identificables.
La redacción ocurre durante la transcripción. Los datos sensibles se eliminan antes de que lleguen a tu almacenamiento o sistemas posteriores.
Esto es especialmente relevante para equipos de salud, finanzas y soporte al cliente, donde el cumplimiento normativo exige tratar los datos personales antes de almacenar o compartir las transcripciones.
En India, es habitual mezclar inglés con hindi, telugu, kannada y otros idiomas índicos. Muchos sistemas de transcripción transliteran palabras en inglés a escrituras índicas, generando transcripciones que no reflejan cómo se comunica la gente realmente.
Scribe v2 transcribe las palabras en inglés en inglés, sin importar el idioma que las rodea. Funciona automáticamente, sin necesidad de configurar el idioma. Da igual si envías inglés, hindi o ningún código de idioma: las palabras en inglés se mantienen en alfabeto latino.
Esto se aplica a todos los idiomas índicos, no solo al hindi-inglés. Si alguien cambia entre telugu e inglés o kannada e inglés, las partes en inglés se transcriben correctamente.
Presentamos el modo No Verbatim, una opción de transcripción que elimina automáticamente muletillas como "eh" y "em", frases repetidas y tartamudeos.
El resultado es una transcripción limpia y fácil de leer, sin necesidad de editar ni procesar después.
El modo No Verbatim es ideal para notas de reuniones, subtítulos y cualquier flujo de trabajo donde busques un texto pulido en vez de una captura literal de cada sonido.
Ahora keyterm prompting admite hasta 1.000 palabras y frases por transcripción, frente al límite anterior de 100.
Esto da más margen a equipos que trabajan con vocabulario técnico amplio, catálogos de productos o terminología específica para guiar al modelo hacia una transcripción precisa.
Keyterm prompting sigue siendo contextual. El modelo utiliza el audio que rodea para decidir si un término clave aplica, en vez de insertarlo sin más. Con 1.000 términos, supone 10 veces más capacidad que antes.
Nota: Las solicitudes con más de 100 keyterms tienen una unidad mínima facturable de 20 segundos.
Estas funciones ya están disponibles en la API y la interfaz de Scribe v2.
Consulta la documentación:
https://elevenlabs.io/docs/cookbooks/speech-to-text/quickstart
Pruébalo en la app:
https://elevenlabs.io/app/speech-to-text
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)
.webp&w=3840&q=80)