ElevenLabs sort de la phase «bêta» et lance Eleven Multilingual v2, un modèle de conversation IA en 30 langues

Publié: 22 août 2023

ÉcouterÉcouter cet article

0:00

0:000:00

La plateforme de voix IA ElevenLabsfait un bond en avant dans ses efforts pour éliminer les barrières linguistiques des différents contenus avec le lancement d'un nouveau modèle d'apprentissage profond, qui présente des capacités multilingues en 30 langues : Eleven Multilingue v2.
Cette avancée permettra aux médias, aux développeurs de jeux, aux éditeurs et aux créateurs indépendants du monde entier d'améliorer considérablement l'accessibilité de leurs contenus.
Ces nouvelles capacités, qui arrivent après une série de lancements de fonctionnalités et d'améliorations depuis le lancement de la plateforme en janvier, marquent également officiellement la fin de la phase « bêta » de l'entreprise.
L'objectif d'ElevenLabs est de rendre tous les contenus accessibles de manière universelle, dans n'importe quelle langue et avec n'importe quelle voix.

Londres, Royaume-Uni - ElevenLabs, leader mondial du logiciel de voix IA, a lancé aujourd'hui un nouveau modèle de génération de voix multilingue en 30 langues, capable de produire avec précision un audio « émotionnellement riche » généré par IA.

Cette avancée, entièrement basée sur des recherches internes, permettra aux créateurs de produire du contenu audio localisé pour les marchés internationaux d'Europe, d'Asie et du Moyen-Orient. ElevenLabs a consacré les 18 derniers mois à analyser les marqueurs de la parole humaine, ce qui lui a permis de créer de nouveaux mécanismes pour comprendre le contexte et transmettre des émotions à la génération de la parole, ainsi que de synthétiser des voix nouvelles et uniques.

Avec Eleven Multilingual v2, en introduisant un texte dans la plateforme de Text to Speech d'ElevenLabs, le nouveau modèle peut identifier automatiquement environ 30 langues et générer une voix avec un niveau d'authenticité sans précédent.

En même temps, que ce soit avec une voix synthétique ou une voix clonée, les caractéristiques vocales uniques du locuteur sont conservées dans toutes les langues, y compris son accent original. Cela signifie que la même voix peut donner vie au contenu dans 30 langues différentes.

Ce lancement arrive après la publication de Professional

Les langues prises en charge incluent coréen, néerlandais, turc, suédois, indonésien, vietnamien, philippin, ukrainien, grec, tchèque, finnois, roumain, danois, bulgare, malais, hongrois, norvégien, slovaque, croate, arabe classique et tamoul. Ils rejoignent les langues précédemment disponibles, y compris l'anglais, le polonais, l'allemand, l'espagnol, le français, l'italien, le hindi et le portugais.

Après les récents lancements de nouvelles fonctionnalités, et avec les améliorations continues de la plateforme, ElevenLabs a également confirmé aujourd'hui que la plateforme sortira officiellement de la phase « bêta ». Cette transition marque un moment crucial dans l'engagement de l'entreprise : fournir des outils fiables et de pointe à ses plus de 1 million d'utilisateurs mondiaux.

À l'avenir, ElevenLabs prévoit d'introduire un mécanisme permettant aux utilisateurs de partager des voix sur la plateforme et de bénéficier du développement de nouveaux fichiers audio, ce qui favoriserait les opportunités de collaboration entre les humains et l'IA.

Mati Staniszewski, directeur exécutif (PDG) et cofondateur d'ElevenLabs, commente :

« ElevenLabs est né avec le rêve de rendre tous les contenus accessibles de manière universelle, dans n'importe quelle langue et avec n'importe quelle voix. Avec le lancement d'Eleven Multilingual v2, nous sommes un pas de plus vers la réalisation de ce rêve et vers la disponibilité des voix de qualité humaine créées par intelligence artificielle dans tous les dialectes ».

« Nos outils de génération "de texte à voix" contribuent à l'égalité des chances et offrent des capacités audio parlées de haute qualité à tous les créateurs. Ces avantages s'étendent désormais aux applications multilingues dans près de 30 langues. Avec le temps, nous espérons couvrir encore plus de langues et de voix avec l'aide de l'IA, et éliminer les barrières linguistiques dans les contenus. Chez ElevenLabs, nous croyons que ces avancées en matière d'accessibilité favoriseront finalement une plus grande créativité, innovation et diversité ».

En réduisant les coûts et les ressources nécessaires pour créer des contenus audio de haute qualité dans plusieurs langues, ElevenLabs permet aux entreprises et aux créateurs de produire des contenus plus imaginatifs et accessibles dans toutes les cultures et langues.

Pour les développeurs et éditeurs de jeux indépendants, l'outil de génération de voix multilingue offre de nouvelles opportunités pour traduire des expériences de jeu et des contenus audio destinés à des audiences internationales, connectant ainsi avec les joueurs et auditeurs dans leurs propres langues sans compromettre la qualité ou la précision de l'audio parlé.

De même, les institutions éducatives disposent maintenant des moyens nécessaires pour fournir instantanément à leurs étudiants des contenus audio précis et dans les langues cibles, renforçant ainsi les compétences de compréhension et de prononciation des différentes langues, ainsi que pour répondre aux différents styles d'enseignement et aux besoins d'apprentissage des étudiants du monde entier.

Tout type de créateur peut utiliser l'outil d'ElevenLabs pour améliorer l'accessibilité de leurs contenus pour les personnes malvoyantes ou ayant des besoins d'apprentissage supplémentaires, de sorte que les contenus visuels soient complétés par les audios disponibles en plusieurs langues.

Le premier ensemble d'outils de voix IA, présenté en janvier 2023, incluait la capacité de convertir n'importe quel texte en voix grâce à une sélection de voix synthétiques prédéfinies et la capacité de créer un clone de la voix de l'utilisateur. L'outil de synthèse de voix multilingue est un pas de plus dans l'objectif d'ElevenLabs de rendre tous les contenus accessibles de manière universelle, dans n'importe quelle langue et avec n'importe quelle voix.

Cette technologie a déjà été adoptée dans de nombreux secteurs et domaines créatifs, permettant aux auteurs indépendants de créer des livres audio, de donner voix à des personnages secondaires dans les jeux vidéo, de soutenir les personnes malvoyantes pour accéder à des contenus écrits en ligne et même d'activer la première chaîne de radio IA au monde. ElevenLabs s'est associé à certains des principaux studios et créateurs de contenus, comme les générateurs de vidéos IA D-ID, l'un des plus grands éditeurs de livres audio au monde, Storytel, la plateforme de vidéo scientifique en accès libre ScienceCast, dont l'outil de génération de vidéo condense les travaux de recherche scientifique publiés sur arXiv, la plateforme leader mondiale de création de contenus, TheSoul Publishing, les développeurs de certains des jeux les plus incroyables, comme Embark Studios et Paradox Interactive, et la plateforme de médias MNTN.

ElevenLabs sort de la phase «bêta» et lance Eleven Multilingual v2, un modèle de conversation IA en 30 langues

Articles similaires

Découvrez Dubbing v2

Découvrez Music v2

Eleven v3 est désormais disponible pour tous

Présentation de Scribe v2