Síntesis de Voz 2.0

¡Con esta actualización, la síntesis de voz será aún mejor! Hemos realizado cambios en cómo entrenamos el modelo, obteniendo mejores resultados en fragmentos más largos. Puedes ir al panel habitual para probarlo de inmediato. Nuestros cambios principales incluyen:

  • Soporte para entrada con mayúsculas, lo que facilita al modelo leer nombres (como OpenAI o ChatGPT) y construir pausas entre fragmentos o nombres
  • Entrenamiento más largo y mejor: el modelo parece rendir mejor en nuestros benchmarks de formato largo y en las funciones de pérdida
  • Componentes necesarios para soportar el relleno: cambios contextuales en fragmentos
  • Componentes necesarios para extender el modelo a través de idiomas en la misma plataforma

Se espera que tus Voces clonadas o predeterminadas resulten en cambios menores. ¡Disfruta!

Descubre artículos del equipo de ElevenLabs

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión