TIME Brings Conversational AI to Journalism
Build a deeper understanding through 1:1 conversations
Londres, Royaume-Uni - ElevenLabs, le leader mondial des logiciels d’IA vocale, a lancé aujourd’hui un nouveau modèle de génération vocale multilingue capable de produire avec précision des sons d’IA « riches en émotions » en 30 langues.
Cette avancée, entièrement basée sur des recherches internes, permettra aux créateurs de produire des contenus audio localisés pour les marchés internationaux d’Europe, d’Asie et du Moyen-Orient. ElevenLabs a passé les 18 derniers mois à analyser les caractéristiques de la parole humaine, à créer de nouveaux mécanismes pour comprendre le contexte et transmettre des émotions dans la génération de la parole, ainsi qu’à synthétiser des voix nouvelles et uniques.
Avec Eleven Multilingual v2, lorsqu’un texte est saisi dans la plateforme de synthèse vocale ElevenLabs, le nouveau modèle peut identifier automatiquement près de 30 langues écrites et y générer de la parole avec un niveau d’authenticité sans précédent.
Par ailleurs, qu’il s’agisse d’une voix synthétique ou d’une voix clonée, les caractéristiques uniques de la voix du locuteur sont conservées dans toutes les langues, y compris son accent d’origine. Ainsi, la même voix peut être utilisée pour donner vie à un contenu dans 30 langues différentes.
Ce déploiement fait suite au lancement du clonage vocal professionnel à tous les créateurs de la plateforme. Cette mise à jour du produit, qui a été lancée en même temps que des fonctionnalités de sécurité supplémentaires, permet aux utilisateurs de créer une copie numérique parfaite de leur propre voix ; qui est pratiquement
impossible à distinguer de l’originale. Grâce à cette nouvelle version, votre voix pourra s’exprimer dans les quelque 30 langues proposées par le modèle multilingue.
Les langues prises en charge comprennent : le coréen, le néerlandais, le turc, le suédois, l’indonésien, le vietnamien, le philippin, l’ukrainien, le grec, le tchèque, le finnois, le roumain, le danois, le bulgare, le malais, le hongrois, le norvégien, le slovaque, le croate, l’arabe classique et le tamoul. Elles viennent se joindre aux langues précédemment disponibles, notamment l’anglais, le polonais, l’allemand, l’espagnol, le français, l’italien, l’hindi et le portugais.
Suite aux récents lancements de fonctionnalités et aux améliorations continues de la plateforme, ElevenLabs a également confirmé aujourd’hui que la plateforme sortait officiellement de sa phase bêta. Cette transition marque un tournant dans l’engagement de l’entreprise à fournir des outils fiables et de pointe à ses plus d’un million d’utilisateurs dans le monde.
À l’avenir, ElevenLabs prévoit d’introduire un mécanisme permettant aux utilisateurs de partager leurs voix sur la plateforme et de bénéficier du développement de nouveaux sons, favorisant ainsi les possibilités de collaboration entre l’humain et l’intelligence artificielle.
Mati Staniszewski, PDG et co-fondateur d’ElevenLabs, commente :
« ElevenLabs a été créée dans le but de rendre tout contenu universellement accessible dans n’importe quelle langue et avec n’importe quelle voix. Avec la sortie d’Eleven Multilingual v2, nous nous rapprochons un peu plus de notre objectif, qui est de faire de ce rêve une réalité et de mettre à disposition des voix d’IA de qualité humaine dans tous les dialectes.
« Nos outils de synthèse vocale permettent de mettre tout le monde sur un pied d’égalité et d’offrir à tous les créateurs des capacités audio vocales de qualité supérieure. Ces avantages s’étendent désormais aux applications multilingues dans près de 30 langues. À terme, nous espérons couvrir encore plus de langues et de voix avec l’aide de l’IA, et éliminer les barrières linguistiques au contenu. Chez ElevenLabs, nous pensons que ces progrès en matière d’accessibilité favoriseront à terme la créativité, l’innovation et la diversité. »
En réduisant les coûts et les ressources nécessaires à la création d’un contenu audio de haute qualité dans plusieurs langues, ElevenLabs permet aux entreprises et aux créateurs de produire un contenu plus imaginatif et plus accessible qui prend en considération toutes les cultures et toutes les langues.
Pour les développeurs et les éditeurs de jeux indépendants, l’outil de génération vocale multilingue permet de traduire les expériences de jeu et le contenu audio pour des publics internationaux, en établissant un lien avec les joueurs et les auditeurs dans leur propre langue sans compromettre la qualité ou la précision de l’audio parlé.
De même, les établissements d’enseignement ont désormais les moyens de fournir instantanément aux apprenants un contenu audio précis dans les langues cibles, ce qui permet de renforcer les compétences en matière de compréhension et de prononciation des langues et de répondre aux différents styles d’enseignement et aux besoins d’apprentissage des étudiants internationaux.
Les créateurs de tous types peuvent utiliser l’outil d’ElevenLabs pour améliorer l’accessibilité du contenu pour les personnes souffrant de déficiences visuelles ou ayant des besoins d’apprentissage supplémentaires, en complétant le contenu visuel par un discours disponible dans plusieurs langues.
Son premier ensemble d’outils vocaux d’IA, dévoilé en janvier 2023, comprenait la possibilité de transformer n’importe quel texte en parole grâce à une sélection de voix synthétiques préconçues et la possibilité de créer un clone de votre propre voix. L’outil de synthèse vocale multilingue est une nouvelle étape dans la mission d’ElevenLabs qui consiste à rendre tous les contenus universellement accessibles dans n’importe quelle langue et avec n’importe quelle voix.
La technologie a déjà été adoptée dans de nombreux secteurs et verticales créatifs, notamment en permettant à des auteurs indépendants de créer des livres audio, en donnant une voix à des personnages secondaires dans des jeux vidéo, en aidant les malvoyants à accéder à des contenus écrits en ligne et en alimentant la première chaîne de radio IA au monde. ElevenLabs s’est également associée à une gamme de créateurs et de studios de contenu de premier plan, notamment les générateurs de vidéos d’IA D-ID, l’un des plus grands éditeurs de livres audio au monde , Storytel, la plateforme de vidéos scientifiques en libre accès ScienceCast dont l’outil de génération de vidéos regroupe les documents de recherche scientifique publiés sur arXiv, laprincipale plateforme mondiale de création de contenu TheSoul Publishing, des développeurs de jeux incroyables comme Embark Studios et Paradox Interactive, et la plateforme multimédia MNTN.
Build a deeper understanding through 1:1 conversations
Get $50+ in credits from each of the leading AI developer tools