Comment fonctionne la remise de 80 % sur Eleven v3 ?

Eleven v3 est à -80 % jusqu’à fin juin 2025 pour les utilisateurs en libre-service via l’interface.

Comment les exemples audio de la vidéo et du site ont-ils été générés ?

Ils ont été générés uniquement avec le modèle Eleven v3.

Comment fonctionne la génération de dialogues ?

Text to Dialogue combine plusieurs voix pour créer une interaction fluide entre elles. En adaptant la prosodie, la gamme émotionnelle et en utilisant les balises audio, Text to Dialogue permet de générer des conversations naturelles et engageantes.

Est-ce disponible via l’API ?

L’API publique pour Eleven v3 (alpha) arrive bientôt. Pour un accès anticipé, contactez le service commercial .

Quelles balises audio sont prises en charge ?

Eleven v3 prend en charge de nombreuses balises audio, qui dépendent de la voix et du contexte. Consultez la pour plus d’informations.

Quelles langues sont prises en charge ?

Afrikaans (afr), Arabe (ara), Arménien (hye), Assami (asm), Azerbaïdjanais (aze), Biélorusse (bel), Bengali (ben), Bosniaque (bos), Bulgare (bul), Catalan (cat), Cebuano (ceb), Chichewa (nya), Croate (hrv), Tchèque (ces), Danois (dan), Néerlandais (nld), Anglais (eng), Estonien (est), Philippin (fil), Finnois (fin), Français (fra), Galicien (glg), Géorgien (kat), Allemand (deu), Grec (ell), Gujarati (guj), Haoussa (hau), Hébreu (heb), Hindi (hin), Hongrois (hun), Islandais (isl), Indonésien (ind), Irlandais (gle), Italien (ita), Japonais (jpn), Javanais (jav), Kannada (kan), Kazakh (kaz), Kirghiz (kir), Coréen (kor), Letton (lav), Lingala (lin), Lituanien (lit), Luxembourgeois (ltz), Macédonien (mkd), Malais (msa), Malayalam (mal), Chinois mandarin (cmn), Marathi (mar), Népali (nep), Norvégien (nor), Pachto (pus), Persan (fas), Polonais (pol), Portugais (por), Pendjabi (pan), Roumain (ron), Russe (rus), Serbe (srp), Sindhi (snd), Slovaque (slk), Slovène (slv), Somali (som), Espagnol (spa), Swahili (swa), Suédois (swe), Tamoul (tam), Télougou (tel), Thaï (tha), Turc (tur), Ukrainien (ukr), Ourdou (urd), Vietnamien (vie), Gallois (cym)

Présentation de Eleven v3 (alpha)

Rédigé par: Piotr Dabkowski; Mati Staniszewski
Publié: 3 juin 2025

ÉcouterÉcouter cet article

0:00

0:000:00

Contacter les ventes

Nous sommes ravis de vous présenter Eleven v3 (alpha) — le modèle Text to Speech le plus expressif.

Eleven v3 n’est plus en version alpha et est désormais disponible pour tous.

Plus de 70 langues
Dialogue multi-intervenants
Balises audio comme [excited], [whispers] et [sighs]

Plus de 70 langues demande plus de prompt engineering que les modèles précédents — mais le résultat est bluffant.

Si vous travaillez sur des vidéos, des livres audio ou des outils médias, vous accédez à un nouveau niveau d'expressivité. Pour les usages en temps réel ou conversationnels, nous vous conseillons de rester sur v2.5 Turbo ou Flash pour l’instant. Une version temps réel de v3 est en cours de développement.

Si vous travaillez sur des vidéos, livres audio, ou des outils médias — cela ouvre un nouveau niveau d'expressivité. Pour les usages en temps réel ou conversationnels, nous vous conseillons de rester sur v2.5 Turbo ou Flash pour l’instant. Une version temps réel de v3 est en cours de développement.

Pourquoi nous avons créé v3

Pourquoi nous avons créé v3l’expressivité. Des émotions plus marquées, des interruptions naturelles et des échanges crédibles étaient difficiles à obtenir.

Depuis le lancement de Multilingual v2, la voix IA a été adoptée dans le cinéma professionnel, le développement de jeux, l’éducation et l’accessibilité. Mais la limite principale n’était pas la qualité sonore — c’était

Eleven v3 comble ce manque. Nous l’avons conçu pour générer des voix qui soupirent, chuchotent, rient et réagissent — pour un rendu vivant et naturel.

Feature	What it unlocks
Audio tags	Inline control of tone, emotion, and non-verbal reactions
Dialogue mode	Multi-speaker conversations with natural pacing and interruptions
70+ languages	Full coverage of high-demand global languages
Deeper text understanding	Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Utiliser les balises audio

Utiliser les balises audioguide de prompting pour v3 dans la documentation.

Les balises audio s’intègrent directement dans votre script et s’écrivent entre crochets en minuscules. Retrouvez plus d’informations sur les balises audio dans notre

Les clones vocaux professionnels (PVC) ne sont pas encore totalement optimisés pour Eleven v3, ce qui peut entraîner une qualité de clonage inférieure par rapport aux modèles précédents. Pendant cette phase de prévisualisation, il est préférable d’utiliser un Instant Voice Clone (IVC) ou une voix conçue pour votre projet si vous souhaitez profiter des fonctionnalités de v3. L’optimisation des PVC pour v3 arrive bientôt.

“[happily][shouts] We did it! [laughs].”

Créer un dialogue multi-intervenants

Créer un dialogue multi-intervenantsendpoint Text to Dialogue API. Fournissez un tableau structuré d’objets JSON — chacun représentant une prise de parole — et le modèle génère un fichier audio cohérent et superposé :

[
  {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
  {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
  {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
]

L’endpoint gère automatiquement les transitions de locuteur, les changements d’émotion et les interruptions.

Le point de terminaison gère automatiquement les transitions entre intervenants, les changements d’émotion et les interruptions.ici.

v3 is our most expressive model

Tarifs et disponibilité

Plan	Launch promo	At the end of June
UI (self-serve)	80% off (~5× cheaper)	Same as Multilingual V2
UI (enterprise)	80% off business plan pricing	Business plan pricing

Pour activer v3 :

Utilisez le sélecteur de modèle et choisissez Eleven v3 (alpha)

L’accès API et le support dans Studio arrivent bientôt. Pour un accès anticipé, contactez le service commercial.

L’accès API et la prise en charge dans Studio arrivent bientôt. Pour un accès anticipé,

Quand ne pas utiliser v3

Eleven v3 (alpha) demande plus de prompt engineering que nos modèles précédents. Quand ça fonctionne, le rendu est bluffant, mais la fiabilité et la latence plus élevée ne conviennent pas aux usages en temps réel ou conversationnels. Pour ces cas, nous recommandons Eleven v2.5 Turbo/Flash.documentation complète de v3 et la FAQ.

Try it today

Connectez-vous à l’interface ElevenLabs
Sélectionnez v3 (alpha) dans la liste des modèles
Collez votre script — utilisez des balises ou un dialogue
Générez l’audio

Nous avons hâte de voir comment vous allez donner vie à v3 dans de nouveaux usages — de la narration immersive à la production cinématographique.

Présentation de Eleven v3 (alpha)

Pourquoi nous avons créé v3

Eleven v3 comble ce manque. Nous l’avons conçu pour générer des voix qui soupirent, chuchotent, rient et réagissent — pour un rendu vivant et naturel.

Hear v3 for yourself

Utiliser les balises audio

Créer un dialogue multi-intervenants

v3 is our most expressive model

Tarifs et disponibilité

L’accès API et la prise en charge dans Studio arrivent bientôt. Pour un accès anticipé,

Try it today

Articles similaires

Découvrez Scribe v2 Realtime

Eleven Music est là

Présentation de Voice Design v3

Découvrez Scribe