Présentation de Eleven v3 Alpha

Essayez v3

ElevenLabs sort de la phase bêta et lance Eleven Multilingual v2 – un modèle linguistique IA de base pour 30 langues

  • ElevenLabs, la plateforme pour l'IA linguistique, fait un pas radical en avant dans sa quête de surmonter les barrières linguistiques dans les contenus en publiant un nouveau modèle de deep learning qui prend en charge des capacités multilingues dans 30 langues – Eleven Multilingual v2
  • Cette évolution permettra aux entreprises médiatiques, développeurs de jeux, éditeurs et auteurs indépendants du monde entier d'améliorer considérablement l'accessibilité de leurs contenus
  • Ces nouvelles capacités, qui suivent une série de nouvelles fonctionnalités et améliorations depuis le lancement de la plateforme en janvier, marquent également la fin officielle de la phase bêta de l'entreprise
  • ElevenLabs s'est donné pour mission de rendre tous les contenus universellement accessibles dans toutes les langues et avec toutes les voix

Londres, Royaume-Uni ElevenLabs, le leader mondial des logiciels de reconnaissance vocale artificielle, a lancé aujourd'hui un nouveau modèle multilingue de génération vocale, capable de produire des audios IA « riches en émotions » dans 30 langues.

Le développement, entièrement basé sur la recherche interne, permettra aux développeurs de produire des contenus audio localisés pour les marchés internationaux en Europe, Asie et Moyen-Orient. ElevenLabs a analysé les marqueurs de la langue humaine au cours des 18 derniers mois, développé de nouveaux mécanismes pour comprendre le contexte et exprimer les émotions dans la génération vocale, et synthétisé de nouvelles voix uniques.

Avec Eleven Multilingual v2 le nouveau modèle peut reconnaître automatiquement presque 30 langues écrites lors de l'entrée de texte dans la plateforme Text to Speech d'ElevenLabs et générer de la parole dans ces langues avec un degré d'authenticité jamais atteint.

Que ce soit une voix synthétique ou clonée, les caractéristiques vocales uniques des locuteurs sont préservées dans toutes les langues, y compris l'accent d'origine. Cela signifie qu'une même voix peut donner vie à des contenus dans 30 langues différentes.

Cette introduction suit la mise à disposition publique de Professional Voice Cloning pour tous les créatifs sur la plateforme. Avec cette mise à jour produit, publiée avec des fonctionnalités de sécurité supplémentaires, les utilisateurs peuvent créer une copie numérique parfaite de leur propre voix, qui

est pratiquement indiscernable de l'original. Avec la publication d'aujourd'hui, votre voix peut parler dans presque 30 langues disponibles dans le cadre du modèle multilingue.

Les langues prises en charge incluent : coréen, néerlandais, turc, suédois, indonésien, vietnamien, filipino, ukrainien, grec, tchèque, finnois, roumain, danois, bulgare, malais, hongrois, norvégien, slovaque, croate, arabe standard et tamoul. Ces langues complètent celles déjà disponibles : anglais, polonais, allemand, espagnol, français, italien, hindi et portugais.

Après l'introduction de nouvelles fonctionnalités et l'amélioration continue de la plateforme, ElevenLabs a également confirmé aujourd'hui que la plateforme a officiellement quitté la phase bêta. Cette transition marque un moment décisif dans l'engagement de l'entreprise à fournir à ses plus d'un million d'utilisateurs dans le monde des outils fiables et à la pointe de la technologie.

Pour l'avenir, ElevenLabs prévoit d'introduire un mécanisme permettant aux utilisateurs de partager leurs voix sur la plateforme et de bénéficier du développement de nouvelles données audio pour favoriser la collaboration entre l'humain et l'IA.

Mati Staniszewski, PDG et fondateur d'ElevenLabs, a déclaré :

« ElevenLabs a été fondé avec le rêve de rendre tous les contenus universellement accessibles dans toutes les langues et avec toutes les voix. Avec la publication d'Eleven Multilingual v2, nous nous rapprochons de la réalisation de ce rêve en rendant les voix IA de qualité humaine disponibles dans chaque dialecte.

Nos outils de synthèse vocale ouvrent la voie à tous les créatifs en leur offrant des options de synthèse vocale de haute qualité. Ces avantages s'étendent désormais aux applications multilingues dans presque 30 langues. Finalement, nous espérons, avec l'aide de l'IA, couvrir encore plus de langues et de voix et éliminer les barrières linguistiques pour les contenus. Chez ElevenLabs, nous croyons que ces avancées en matière d'accessibilité conduiront finalement à plus de créativité, d'innovation et de diversité. »

ElevenLabs réduit les coûts et les ressources nécessaires pour créer des contenus audio de haute qualité dans plusieurs langues. Les entreprises et les créatifs peuvent ainsi produire des contenus plus inventifs et plus accessibles, qui résonnent au-delà des frontières culturelles et linguistiques.

Aux développeurs et éditeurs de jeux indépendants, l'outil de génération vocale multilingue offre de nouvelles possibilités pour traduire les expériences de jeu et les contenus audio pour un public international et communiquer avec les joueurs et auditeurs dans leur propre langue, sans compromettre la qualité ou la précision de la sortie vocale.

De même, les établissements d'enseignement ont désormais la possibilité de fournir aux apprenants des contenus audio précis dans la langue cible pour améliorer la compréhension et la prononciation, et répondre aux différents styles d'enseignement et besoins d'apprentissage des étudiants internationaux.

Les créatifs de tous horizons peuvent utiliser l'outil d'ElevenLabs pour améliorer l'accessibilité de leurs contenus pour les personnes malvoyantes ou ayant des besoins d'apprentissage supplémentaires, en enrichissant les contenus visuels avec de la parole dans plusieurs langues.

La première suite d'outils vocaux IA, présentée en janvier 2023, offre la possibilité de transformer n'importe quel texte en parole, grâce à une sélection de voix synthétiques prédéfinies et la possibilité de créer un clone de sa propre voix. L'outil de synthèse vocale multilingue est une étape supplémentaire dans la mission d'ElevenLabs de rendre tous les contenus universellement accessibles dans toutes les langues et avec toutes les voix.

La technologie est déjà utilisée dans une variété de secteurs créatifs. Elle permet aux auteurs indépendants d'écrire des livres audio, de donner voix aux personnages secondaires dans les jeux vidéo, de faciliter l'accès aux contenus écrits en ligne pour les personnes malvoyantes et de gérer la première station de radio IA au monde. ElevenLabs a également noué des partenariats avec plusieurs créateurs de contenu et studios de premier plan, dont le générateur de vidéos IA D-ID, Storytel, l'un des plus grands éditeurs de livres audio au monde, la plateforme vidéo en accès libre ScienceCast, dont l'outil de génération vidéo agrège des travaux de recherche scientifique publiés sur arXiv, la plateforme de création de contenu leader mondial TheSoul Publishing, des développeurs de jeux incroyables comme Embark Studios et Paradox Interactive et la plateforme médiatique MNTN.

En voir plus

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter