Pronunciación de números de Turbo v2

Nuestro modelo más rápido ahora tiene una pronunciación de números mejorada

II Turbo V2

En noviembre anunciamos nuestro nuevo modelo más rápido que genera voz en ≈400 ms de latencia (+ latencia de red) y se acabó el doble de rápido como nuestros modelos V1.

Desafortunadamente, los usuarios descubrieron que tenía dificultades para pronunciar números largos. Escuche esta generación de "El precio actual de las acciones de NVIDIA es $867,49":

 / 

Hoy acabamos de lanzar una pronunciación de números mejorada para nuestro modelo Turbo v2. Aquí está la pronunciación después del cambio:

 / 

Gracias a todos los usuarios que enviaron comentarios que inspiraron esta solución. Continúen compartiendo áreas en las que se pueden mejorar nuestros modelos.

Descubre artículos del equipo de ElevenLabs

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión