Présentation de Eleven v3 Alpha

Essayez v3

Première plateforme de synthèse vocale longue durée pour éditeurs et créateurs

La première plateforme de génération vocale longue durée de haute qualité

Ce mois de novembre, nous lançons la première plateforme de synthèse vocale qui permet aux éditeurs et créateurs de générer du contenu long de haute qualité et émotionnellement captivant.

Pour qui est-ce destiné ?

Nous avons choisi cette direction pour plusieurs raisons. Il n'existe actuellement aucun outil capable de générer un discours long d'une qualité suffisante pour être utilisé dans les actualités ou les livres audio. Notre équipe est passionnée par tout ce qui touche à l'audio et nous avons estimé que relever les défis posés par le contenu plus long est une étape naturelle vers la réalisation de nos ambitions. Mais nous sommes également particulièrement enthousiastes à l'idée de considérer cela comme notre caractéristique distinctive - nous sommes la première plateforme technologique de voix IA à offrir aux créateurs et éditeurs des voix les plus émouvantes, riches et réalistes pour une qualité de narration ultime.

À cet égard, notre plateforme vous permet de générer et de télécharger un discours de haute qualité, digne d'un doubleur, à partir de n'importe quel texte - qu'il s'agisse d'articles de presse, de livres, de newsletters, de blogs ou de documents académiques. Vous pouvez choisir n'importe quelle voix pour lire le contenu - soit à partir d'un ensemble de voix synthétiques prédéfinies, soit en clonant une voix à partir d'un échantillon que vous fournissez. Les utilisations que nous imaginons pour notre technologie sont infinies. De l'accessibilité inter-médias du contenu existant, en passant par l'augmentation de la productivité, à la revitalisation des textes du passé en les convertissant en audio, ou à la création de nouveaux contenus. Notre prochain objectif est d'étendre le support à d'autres langues.

Qu'est-ce qui rend Eleven différent ?

Comment nous y parvenons dépend de la façon dont nous avons construit notre modèle. Il est entraîné à comprendre ce qui est dit et à ajuster la livraison en conséquence. Il le fait en tenant compte non seulement du sens des mots mais aussi du contexte entourant chaque énoncé.

Les algorithmes traditionnels de génération de discours produisent des énoncés phrase par phrase. Cela demande moins de calculs mais semble immédiatement robotique. Les émotions et l'intonation doivent souvent s'étendre et résonner sur plusieurs phrases pour lier ensemble une idée particulière. Le ton et le rythme transmettent l'intention, ce qui rend vraiment le discours humain. Plutôt que de générer chaque énoncé séparément, notre modèle prend en compte le contexte environnant, maintenant un flux et une prosodie appropriés sur l'ensemble du matériel généré. Cette profondeur émotionnelle, couplée à une qualité audio de premier ordre, offre aux utilisateurs l'outil de narration le plus authentique et captivant qui soit.

Devenez notre bêta-testeur

Notre plateforme sera en ligne le mois prochain et vous pouvez vous inscrire pour devenir notre bêta-testeur dès aujourd'hui sur elevenlabs.io

audiostory.ai

Si vous êtes curieux d'entendre notre logiciel en action, rendez-vous sur audiostory.ai - un projet parallèle par ElevenLabs visant à démontrer nos capacités de génération de discours long format où nous utilisons nos voix synthétiques pour lire des articles de presse et des livres du passé. Le premier épisode est un article de 1899 du New York Times sur l'invention de la radio - écoutez-le ici. Ou, si ce n'est pas déjà fait, vous pouvez aller en haut de cette page et écouter cette entrée lue à haute voix.

Découvrez les articles de l'équipe ElevenLabs

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter