Voice Design - La Primera IA Generativa Para Audio

Publicado: 28 feb 2023

EscucharEscucha este artículo

0:00

0:000:00

El mes pasado anunciamos que nuestro modelo generativo para la creación de voces estaba por llegar. Finalmente está aquí y es el primero de su tipo - lo llamamos Diseño de voz. Esta función te permite crear voces nuevas desde cero eligiendo sus características principales como género, edad y acento. Incluso si usas los mismos parámetros, nuestro modelo añade un toque de aleatoriedad cada vez que generas una voz, así que cada resultado es totalmente único.

Try Voice Design

Diseño de voz

El modelo detrás de Voice Design es en gran parte fruto de nuestra investigación en síntesis de voz y

Añadir un grado de control a la selección de voces era importante ya que nuestros usuarios a menudo buscan características concretas de habla para sus guiones. Asegurar que cada voz generada sea única era igualmente crucial, ya que muchos casos de uso requieren, o al menos se benefician de, tener acceso exclusivo a una voz. Además de proporcionar a los usuarios una nueva vía creativa, las voces generadas con Voice Design son completamente artificiales y no pertenecen a ninguna persona real.

Aplicaciones

Además de convertir fácilmente escritos en audio de calidad con nuestra herramienta de Síntesis de voz, autores de libros ahora pueden usar Voice Design para ejercer control artístico sobre la narración y dar forma a la personalidad de cada personaje con voces a medida.

Editores de noticias que se aventuran en el audio necesitan voces para sus historias. Dado que los narradores se identifican con las publicaciones que representan, elegir la locución adecuada se convierte en una tarea importante que no se repite a menudo. Voice Design permite a los editores elegir y comparar virtualmente innumerables narradores al instante. También les da la tranquilidad de tener una voz particular que los represente, y solo a ellos.

Desarrolladores de juegos ya no necesitan decidir si un personaje en particular justifica los costos de grabación. Decenas de miles de NPCs previamente mudos ahora pueden tener personalidades únicas, ampliando los límites de la inmersión virtual.

Ya seas un creador de contenido trabajando en tu próximo lanzamiento o un ejecutivo corporativo buscando dar voz a las comunicaciones de la empresa, las posibilidades de diseñar audio realista y convincente para casos de uso y audiencias específicas son ahora ilimitadas.

Ecosistema

Voice Design es una de las múltiples funciones para la edición de narraciones que planeamos introducir este año. Lo siguiente es Estudio - nuestra nueva estación de trabajo para estructurar textos largos, insertar pausas, regenerar fragmentos de audio y asignar partes del texto a diferentes hablantes. Studio llegará a finales de marzo y se complementará con soporte para edición de entonación más adelante en el segundo trimestre de este año.

Voice Design - La Primera IA Generativa Para Audio

Diseño de voz

Aplicaciones

Ecosistema

Artículos relacionados

Actualizaciones de claves API

Papá Noel es real y está esperando tu llamada

GenFM ahora se reproduce en ElevenReader

Studio ahora es más grande y potente