ElevenLabs sort de la bêta et lance Eleven Multilingual v2 : un modèle de langage IA de base pour 30 langues

Publié: 22 août 2023

ÉcouterÉcouter cet article

0:00

0:000:00

ElevenLabs, la plateforme d’IA linguistique, fait un grand pas en avant dans sa mission de lever les barrières linguistiques dans les contenus, en lançant un nouveau modèle de deep learning qui prend en charge des capacités multilingues dans 30 langues – Eleven Multilingue v2
Cette avancée va permettre aux entreprises médias, aux studios de jeux vidéo, aux éditeurs et aux auteurs indépendants du monde entier de rendre leurs contenus beaucoup plus accessibles
Ces nouvelles capacités, qui s’ajoutent à une série de fonctionnalités et d’améliorations depuis le lancement de la plateforme en janvier, marquent aussi la fin officielle de la phase bêta de l’entreprise
Notre mission chez ElevenLabs est de rendre tous les contenus accessibles dans toutes les langues et avec toutes les voix

Londres, Royaume-Uni– ElevenLabs, leader mondial des logiciels de génération vocale par IA, annonce aujourd’hui le lancement d’un nouveau modèle multilingue de génération de voix, capable de produire des voix IA « riches en émotions » dans 30 langues.

Ce développement, entièrement basé sur notre propre recherche, va permettre aux développeurs de créer des contenus audio localisés pour les marchés internationaux en Europe, en Asie et au Moyen-Orient. Depuis 18 mois, ElevenLabs analyse les marqueurs de la parole humaine, développe de nouveaux mécanismes pour comprendre le contexte et exprimer les émotions dans la synthèse vocale, et crée de nouvelles voix uniques.

Avec Eleven Multilingual v2 le nouveau modèle peut reconnaître automatiquement près de 30 langues écrites saisies sur la plateforme Text to Speech d’ElevenLabs et générer de la voix dans ces langues avec un niveau d’authenticité inédit.

Que vous utilisiez une voix synthétique ou clonée, les caractéristiques uniques de la voix du locuteur sont préservées dans toutes les langues, y compris l’accent d’origine. Cela signifie que la même voix peut donner vie à des contenus dans 30 langues différentes.

Ce lancement fait suite à la sortie publique de Professional

est pratiquement impossible à distinguer de l’original. Dès aujourd’hui, votre voix peut parler dans près de 30 langues grâce au modèle multilingue.

Les langues prises en charge incluent : coréen, néerlandais, turc, suédois, indonésien, vietnamien, filipino, ukrainien, grec, tchèque, finnois, roumain, danois, bulgare, malais, hongrois, norvégien, slovaque, croate, arabe standard et tamoul. Ces langues s’ajoutent à celles déjà disponibles : anglais, polonais, allemand, espagnol, français, italien, hindi et portugais.

Après l’ajout de nouvelles fonctionnalités et l’amélioration continue de la plateforme, ElevenLabs confirme aujourd’hui la sortie officielle de la bêta. Ce passage marque une étape clé dans notre engagement à fournir à plus d’un million d’utilisateurs dans le monde des outils fiables et à la pointe.

À l’avenir, ElevenLabs prévoit de lancer un système permettant aux utilisateurs de partager leurs voix sur la plateforme et de bénéficier du développement de nouvelles données audio, afin de favoriser la collaboration entre humains et IA.

Mati Staniszewski, PDG et fondateur d’ElevenLabs, déclare :

« ElevenLabs est né du rêve de rendre tous les contenus accessibles dans toutes les langues et avec toutes les voix. Avec le lancement d’Eleven Multilingual v2, nous nous rapprochons de ce rêve en rendant les voix IA de qualité humaine disponibles dans chaque dialecte.

Nos outils de synthèse vocale ouvrent la voie à tous les créateurs et leur offrent des options de synthèse vocale de haute qualité. Ces avantages s’étendent désormais aux applications multilingues dans près de 30 langues. Nous espérons, grâce à l’IA, couvrir encore plus de langues et de voix, et lever les barrières linguistiques pour les contenus. Chez ElevenLabs, nous pensons que ces avancées en matière d’accessibilité mèneront à plus de créativité, d’innovation et de diversité. »

ElevenLabs réduit les coûts et les ressources nécessaires pour créer des contenus audio de qualité dans plusieurs langues. Entreprises et créateurs peuvent ainsi produire des contenus plus accessibles et plus créatifs, qui résonnent au-delà des frontières culturelles et linguistiques.

Aux développeurs et éditeurs de jeux indépendants, l’outil de génération vocale multilingue offre de nouvelles possibilités pour traduire les expériences de jeu et les contenus audio pour un public international, et communiquer avec les joueurs et auditeurs dans leur propre langue, sans compromis sur la qualité ou la fidélité de la voix.

De la même façon, les établissements d’enseignement peuvent désormais fournir aux apprenants des contenus audio précis dans la langue cible, pour améliorer la compréhension orale et la prononciation, et s’adapter aux différents styles d’enseignement et besoins des étudiants internationaux.

Tous les créateurs peuvent utiliser l’outil ElevenLabs pour améliorer l’accessibilité de leurs contenus pour les personnes malvoyantes ou ayant des besoins d’apprentissage spécifiques, en enrichissant les contenus visuels avec de la voix dans plusieurs langues.

La première suite d’outils de synthèse vocale IA, lancée en janvier 2023, permet de transformer n’importe quel texte en voix, grâce à un choix de voix synthétiques prédéfinies ou à la possibilité de cloner sa propre voix. L’outil de synthèse vocale multilingue est une étape de plus dans la mission d’ElevenLabs de rendre tous les contenus accessibles dans toutes les langues et avec toutes les voix.

La technologie est déjà utilisée dans de nombreux secteurs créatifs. Elle permet aux auteurs indépendants de créer des livres audio, de doubler des personnages secondaires dans les jeux vidéo, de rendre les contenus écrits en ligne accessibles aux personnes malvoyantes, ou encore d’animer la première radio IA au monde. ElevenLabs a aussi noué des partenariats avec plusieurs créateurs et studios de référence, dont le générateur vidéo IA D-ID, Storytel, l’un des plus grands éditeurs de livres audio au monde, la plateforme vidéo en libre accès ScienceCast, dont l’outil de génération vidéo agrège des travaux de recherche scientifique publiés sur arXiv, la principale plateforme mondiale de création de contenus TheSoul Publishingdes studios de jeux vidéo innovants comme Embark Studioset Paradox Interactiveet la plateforme média MNTN.

ElevenLabs sort de la bêta et lance Eleven Multilingual v2 : un modèle de langage IA de base pour 30 langues

Articles similaires

Découvrez Scribe v2 Realtime

Eleven Music est là

Présentation de Voice Design v3

Présentation de Eleven v3 (alpha)