
ElevenLabs vs. Cartesia (June 2025)
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Presentamos Eleven v3 Alpha
Prueba v3El primer modelo generativo para crear voces sintéticas ya está aquí
El mes pasado anunciamos que nuestro modelo generativo para la creación de voces estaba por llegar. Finalmente está aquí y es el primero de su tipo - lo llamamos Voice Design. La función te permite crear nuevas voces desde cero seleccionando sus cualidades básicas como género, edad y acento. Incluso con los mismos parámetros básicos, nuestro modelo añade aleatoriedad cada vez que generas para asegurar que cada voz que escuches sea completamente única. Voice Design es parte de nuestro esfuerzo por equipar a editores y creadores con las herramientas de narración más versátiles con IA.
El modelo detrás de Voice Design es en gran medida el resultado de nuestra investigación en síntesis de voz y clonación de voces, aunque siempre nos gustó la idea de una herramienta generativa para el habla. Ya hemos visto aplicaciones prácticas para modelos generativos de texto a imagen y chatbots, pero faltaba una herramienta similar para audio. Desde nuestro lanzamiento hemos recibido solicitudes para añadir más voces a nuestro banco. En lugar de saturar la biblioteca con innumerables voces y hacerte escuchar cada vista previa para saber quién es quién, decidimos cambiar el enfoque y dejar que determines la identidad del hablante, permitiendo al mismo tiempo una variedad infinita dentro de estos límites.
Añadir un grado de control a la selección de voces era importante ya que nuestros usuarios a menudo buscan características concretas de habla para sus guiones. Asegurar que cada voz generada sea única era igualmente crucial, ya que muchos casos de uso requieren, o al menos se benefician de, tener acceso exclusivo a una voz. Además de proporcionar a los usuarios una nueva vía creativa, las voces generadas con Voice Design son completamente artificiales y no pertenecen a ninguna persona real.
Además de convertir fácilmente escritos en audio de calidad con nuestra herramienta de Speech Synthesis, autores de libros ahora pueden usar Voice Design para ejercer control artístico sobre la narración y dar forma a la personalidad de cada personaje con voces a medida.
Editores de noticias que se aventuran en el audio necesitan voces para sus historias. Dado que los narradores se identifican con las publicaciones que representan, elegir la locución adecuada se convierte en una tarea importante que no se repite a menudo. Voice Design permite a los editores elegir y comparar virtualmente innumerables narradores al instante. También les da la tranquilidad de tener una voz particular que los represente, y solo a ellos.
Desarrolladores de juegos ya no necesitan decidir si un personaje en particular justifica los costos de grabación. Decenas de miles de NPCs previamente mudos ahora pueden tener personalidades únicas, ampliando los límites de la inmersión virtual.
Ya seas un creador de contenido trabajando en tu próximo lanzamiento o un ejecutivo corporativo buscando dar voz a las comunicaciones de la empresa, las posibilidades de diseñar audio realista y convincente para casos de uso y audiencias específicas son ahora ilimitadas.
Voice Design es una de las múltiples funciones para la edición de narraciones que planeamos introducir este año. Lo siguiente es Studio - nuestra nueva estación de trabajo para estructurar textos largos, insertar pausas, regenerar fragmentos de audio y asignar partes del texto a diferentes hablantes. Studio llegará a finales de marzo y se complementará con soporte para edición de entonación más adelante en el segundo trimestre de este año.
Learn how ElevenLabs and Cartesia compare based on features, price, voice quality and more.
Unlocking the Power of AI Voiceovers for eLearning