ElevenLabs lanza en versión beta Eleven Multilingual v2, un modelo de voz IA básico para 30 idiomas

  • La plataforma de voz IA ElevenLabs ha lanzado Eleven Multilingual v2, un nuevo modelo de deep learning que soporta funciones multilingües en 30 idiomas, intentando eliminar las barreras lingüísticas en el contenido.
  • Este avance permite a medios de comunicación, desarrolladores de juegos, editores y creadores de todo el mundo mejorar significativamente la accesibilidad de su contenido.
  • Desde el lanzamiento de la plataforma en enero, muchas nuevas funciones y mejoras han marcado el fin oficial de la fase beta de la empresa.
  • La misión de ElevenLabs es hacer que todo el contenido sea accesible para todos en cualquier idioma y voz.

Reino Unido Londres - ElevenLabs, líder mundial en software de voz IA, ElevenLabsha lanzado hoy un nuevo modelo de generación de voz multilingüe en 30 idiomas capaz de crear audio IA 'emocionalmente rico' con precisión.

Basado completamente en investigación propia, este avance permite a creadores dirigirse a mercados internacionales en Europa, Asia y Oriente Medio con contenido de audio localizado. ElevenLabs ha pasado los últimos 18 meses analizando métricas del habla humana, construyendo nuevos mecanismos para comprender el contexto y transmitir emociones en la generación del habla, y sintetizando voces nuevas y únicas.

Con Eleven Multilingual v2, cuando se introduce texto en la plataforma de Text to Speech de ElevenLabs, el nuevo modelo identifica automáticamente casi 30 idiomas escritos y puede generar voz en ese idioma con un nivel de autenticidad sin precedentes.

Al mismo tiempo, ya sea utilizando voz sintética o clonada, las características únicas de la voz del hablante se mantienen en todos los idiomas, incluyendo el acento original. Esto significa que puedes dar vida al contenido en 30 idiomas usando la misma voz.

Este lanzamiento sigue a la apertura de Professional Voice Cloning para todos los creadores en la plataforma. Con funciones adicionales de seguridad y protección, esta actualización de producto permite a los usuarios crear una copia digital perfecta de su propia voz, casi indistinguible del original.

El lanzamiento de hoy significa que el modelo multilingüe ahora puede dar voz en casi 30 idiomas.

Los idiomas soportados incluyen coreano, neerlandés, turco, sueco, indonesio, vietnamita, filipino, ucraniano, griego, checo, finlandés, rumano, danés, búlgaro, malayo, húngaro, noruego, eslovaco, croata, árabe clásico y tamil. Se unen a los idiomas previamente disponibles como inglés, polaco, alemán, español, francés, italiano, hindi y portugués.

Tras el reciente lanzamiento de funciones y la mejora continua de la plataforma, ElevenLabs ha confirmado hoy que la plataforma se lanza oficialmente en versión beta. Esta transición marca un momento crucial en el compromiso de la empresa de proporcionar herramientas confiables y de vanguardia a más de un millón de usuarios globales.

En el futuro, ElevenLabs planea introducir mecanismos que permitan a los usuarios compartir voces en la plataforma y disfrutar de los beneficios del nuevo desarrollo de audio, fomentando oportunidades para la colaboración humano-IA.

Mati Staniszewski, CEO y cofundador de ElevenLabs, dice:

“ElevenLabs comenzó con el sueño de hacer que todo el contenido sea accesible para todos en cualquier idioma y voz. Con el lanzamiento de Eleven Multilingual v2, estamos un paso más cerca de hacer realidad este sueño y permitir el uso de voces IA de calidad humana en todos los dialectos. 있도록 하는 걸음 다가갔습니다.

“Las herramientas de generación TTS (Text-to-Speech) nivelan el campo de juego y ayudan a proporcionar a creadores de todo tipo acceso a funciones de audio de voz de la más alta calidad. Estos beneficios ahora se expanden a aplicaciones multilingües en casi 30 idiomas. Esperamos eliminar las barreras lingüísticas para el contenido con más idiomas y voces gracias a la ayuda de la IA. ElevenLabs cree que este salto en accesibilidad fomentará en última instancia una mayor creatividad, innovación y diversidad.장벽을 제거하기를 바랍니다. ElevenLabs 이러한 접근성의 도약이 궁극적으로 창의성, 혁신 다양성을 촉진할 것이라고 믿습니다.”

Al reducir el coste y los recursos necesarios para crear contenido de audio de alta calidad en varios idiomas, ElevenLabs apoya a empresas y creadores para que produzcan contenido más imaginativo y accesible que resuene a través de culturas e idiomas.

Para desarrolladores de juegos independientes y editores, las herramientas de generación de voz multilingüe ofrecen nuevas oportunidades para traducir experiencias de juego y contenido de audio para audiencias internacionales, conectando con jugadores y oyentes en su propio idioma sin comprometer la calidad o precisión del audio de voz.

De manera similar, las instituciones educativas ahora tienen los medios para proporcionar a los estudiantes contenido de audio preciso en el idioma objetivo de inmediato, reforzando la comprensión del idioma y las habilidades de pronunciación, y satisfaciendo diversos estilos de enseñanza y necesidades de aprendizaje para estudiantes internacionales.

Creadores de todo tipo pueden usar las herramientas de ElevenLabs para complementar contenido visual con voz en varios idiomas, mejorando la accesibilidad del contenido para personas con discapacidades visuales o que necesitan aprendizaje adicional.

La suite inicial de herramientas de voz IA lanzada en enero de 2023 incluía la capacidad de convertir cualquier texto en voz a través de una selección de voces sintéticas pre-diseñadas y crear una réplica de la propia voz. Las herramientas de síntesis de voz multilingüe representan otro avance en la misión de ElevenLabs de hacer que todo el contenido sea accesible para todos en cualquier idioma y voz.

Esta tecnología ya ha sido adoptada en varios campos creativos y sectores, permitiendo a escritores independientes crear audiolibros, dar voz a personajes secundarios en videojuegos, ayudar a personas con discapacidades visuales a acceder a contenido escrito en línea y alimentar el primer canal de radio IA del mundo. ElevenLabs también ha establecido asociaciones con D-ID, uno de los mayores editores de audiolibros del mundo, Storytel, la plataforma de video científico de acceso abierto ScienceCast que condensa artículos de investigación científica publicados en arXiv, la plataforma líder de creación de contenido global TheSoul Publishing, Embark Studios y Paradox Interactive, así como con destacados desarrolladores de juegos, plataformas de medios MNTN y otros creadores de contenido y estudios líderes.

Descubre artículos del equipo de ElevenLabs

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión