Passer au contenu

Eleven v3 est désormais disponible pour tous

Eleven v3, notre modèle Text to Speech le plus avancé, sort de l’Alpha et est maintenant accessible à tous.

Eleven v3, our most advanced Text to Speech model, is now out of Alpha and generally available.

Eleven v3, notre modèle Text to Speech le plus avancé, sort de l’Alpha et est maintenant accessible à tous.

Depuis la sortie Alpha, nous avons continué à améliorer le modèle. Deux points clés :

Plus stable. Lors des tests, les utilisateurs ont préféré la nouvelle version dans 72% des cas par rapport à l’Alpha précédente.

Plus précis. Nous avons nettement amélioré la gestion des chiffres, symboles et notations spécialisées dans plusieurs langues.

Améliorations de la précision

Les modèles Text to Speech doivent comprendre ce que vous écrivez et choisir comment le prononcer. Les mêmes symboles peuvent avoir des sens différents selon le contexte.

Prenons un numéro de téléphone : « +49 170 9876543 »

Dans certains cas, nos modèles lisaient cela comme « plus quarante-neuf, cent soixante-dix, neuf millions huit cent soixante-seize mille cinq cent quarante-trois » — en interprétant les chiffres comme un grand nombre au lieu d’une suite de chiffres. La bonne lecture est « plus quatre neuf, un sept zéro, neuf huit sept six cinq quatre trois ».

Ce type d’erreur apparaissait dans plusieurs catégories — scores sportifs, formules chimiques, devises, coordonnées — partout où le modèle devait interpréter des symboles et choisir comment les prononcer.

Nous avons testé sur un référentiel interne couvrant 27 catégories dans 8 langues.

En résumé : 68% d’erreurs en moins. Le taux d’erreur est passé de 15,3% à 4,9%.

Taux d’erreur par catégorie :

Before
Chemical Formulas
45.6%
Phone Numbers
16.9%
URLs / Emails
45.6%
ISBNs
17.9%
License Plates
14.4%
Mathematical Expressions
23.8%
Geographic Coordinates
46.2%
After
Chemical Formulas
0.6%
Phone Numbers
0.6%
URLs / Emails
3.9%
ISBNs
0.0%
License Plates
1.2%
Mathematical Expressions
6.9%
Geographic Coordinates
17.5%
Error Reduction
Chemical Formulas
99%
Phone Numbers
99%
URLs / Emails
91%
ISBNs
100%
License Plates
91%
Mathematical Expressions
71%
Geographic Coordinates
62%

Les progrès sont les plus marqués dans les catégories où le contexte change l’interprétation — par exemple, un deux-points peut indiquer un score, une heure ou un format selon le texte autour.

Exemples

Devises — bonne valeur :

Entrée :  ¥250 000

Avant : 25 000 yens

Après :  250 000 yens

Formules chimiques — symboles correctement conservés :

Entrée :  SO₂

Avant : « soufre double » (illisible)

Après :  « S O deux »

Scores sportifs — interprétation selon le contexte :

Entrée :  Score final : 102-98

Avant : « cent deux moins quatre-vingt-dix-huit »

Après :  « cent deux à quatre-vingt-dix-huit »

Disponibilité

Eleven v3 est maintenant disponible sur toutes les plateformes.

Découvrez les articles de l'équipe ElevenLabs

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter