
Présentation de Eleven v3 (alpha)
Le modèle de Text to Speech le plus expressif
Nous sommes ravis de dévoiler Eleven v3 (alpha) — le modèle Text to Speech le plus expressif.
Cette prévisualisation de recherche apporte un contrôle et un réalisme sans précédent à la génération de la parole avec :
- 70+ langues
- Dialogue multi-locuteurs
- Audio tags like [excited], [whispers], and [sighs]
Eleven v3 (alpha) nécessite plus d'ingénierie de prompt que les modèles précédents — mais les générations sont époustouflantes.
Si vous travaillez sur des vidéos, des livres audio ou des outils médias — cela débloque un nouveau niveau d'expressivité. Pour les cas d'utilisation en temps réel et conversationnels, nous recommandons de rester avec v2.5 Turbo ou Flash pour le moment. Une version en temps réel de v3 est en développement.
Eleven v3 est disponible dès aujourd'hui sur notre site web. L'accès public à l'API arrive bientôt. Pour un accès anticipé, veuillez contacter les ventes.
L'utilisation du nouveau modèle dans l'application ElevenLabs est à 80% de réduction jusqu'à la fin de juin. Inscrivez-vous ici.
Pourquoi nous avons créé v3
Pourquoi nous avons créé v3expressivité. Des émotions plus exagérées, des interruptions conversationnelles et des échanges crédibles étaient difficiles à réaliser.
Depuis le lancement de Multilingual v2, nous avons vu la voix IA adoptée dans le cinéma professionnel, le développement de jeux, l'éducation et l'accessibilité. Mais la limitation constante n'était pas la qualité sonore — c'était
Eleven v3 comble cette lacune. Il a été conçu de A à Z pour offrir des voix qui soupirent, chuchotent, rient et réagissent — produisant une parole qui semble vraiment réactive et vivante.
| Feature | What it unlocks |
|---|---|
| Audio tags | Inline control of tone, emotion, and non-verbal reactions |
| Dialogue mode | Multi-speaker conversations with natural pacing and interruptions |
| 70+ languages | Full coverage of high-demand global languages |
| Deeper text understanding | Better stress, cadence, and expressivity from text input |
Utilisation des balises audio
Utilisation des balises audioguide de prompt pour v3 dans la documentation.
Les balises audio se trouvent en ligne avec votre script et sont formatées avec des crochets carrés en minuscules. Vous pouvez en savoir plus sur les balises audio dans notre
| 1 | “[happily][shouts] We did it! [laughs].” |
Par exemple, vous pourriez suggérer : « [chuchote] Quelque chose arrive… [soupire] Je le sens. » Ou pour un contrôle plus expressif, vous pouvez combiner plusieurs balises :
Créer un dialogue multi-locuteursText to Dialogue API endpoint. Provide a structured array of JSON objects — each representing a speaker turn — and the model generates a cohesive, overlapping audio file:
| 1 | [ |
| 2 | {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."}, |
| 3 | {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."}, |
| 4 | {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"} |
| 5 | ] |
| 6 |
Eleven v3 est pris en charge dans notre point de terminaison Text to Speech existant. De plus, nous introduisons un nouveau
Le point de terminaison gère automatiquement les transitions de locuteur, les changements émotionnels et les interruptions.here.
En savoir plus
| Plan | Launch promo | After 30 days |
|---|---|---|
| UI (self-serve) | 80% off (~5× cheaper) | Same as Multilingual V2 |
| API (self-serve & enterprise) | Same as Multilingual V2 | Same |
| Enterprise UI | Same as Multilingual V2 | Same |
Tarification et disponibilité
- Use the Model Picker and select Eleven v3 (alpha)
Pour activer v3 :contact sales.
L'accès à l'API et le support dans Studio arrivent bientôt. Pour un accès anticipé, veuillez
L'accès à l'API et le support dans Studio arrivent bientôt. Pour un accès anticipé, veuillez
Quand ne pas utiliser v3v3 documentation and FAQ.
- Log in to ElevenLabs UI
- documentation complète de v3 3 (alpha) in the model dropdown
- Paste your script — use tags or dialogue
- Generate audio
We’re excited to see how you bring v3 to life across new use cases — from immersive storytelling to cinematic production pipelines.
Découvrez les articles de l'équipe ElevenLabs


Integrating external agents with ElevenLabs Agents' voice orchestration
Patterns for integrating ElevenLabs voice orchestration with complex and stateful agents









