
Le Walk brings cities to life with ElevenLabs
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Créez des dialogues dynamiques avec plusieurs personnages grâce à Eleven v3 Audio Tags. Scénarisez des voix qui se chevauchent, des interruptions et des changements émotionnels pour des conversations IA naturelles et humaines.
Les conversations font avancer l'histoire. Avec Eleven v3 Audio Tags, vous pouvez maintenant écrire des scènes avec des voix qui se chevauchent, des échanges rapides et des interactions émotionnelles — le tout réalisé par un seul modèle.
En combinant des tags comme [interrupting], [overlapping] ou [laughs], vous pouvez créer un dialogue naturaliste qui coule comme une conversation humaine — avec des interruptions, des changements de ton et des réactions spontanées.
Ce n'est pas juste un discours ligne par ligne. C'est une performance multi-personnages.
Le dialogue multi-personnages, c'est quand un modèle de voix joue plusieurs rôles distincts dans la même scène. Chaque personnage parle avec un style, un ton ou un rythme différent — parfois même en interrompant ou en parlant en même temps.
Avec Eleven v3, vous pouvez écrire ce script directement : Marissa : [commence à parler] Alors je pensais que nous pourrions— Chris : [interrompt] —tester nos nouvelles fonctionnalités de synchronisation ? Marissa : [surprise] Exactement ! Comment as-tu— Chris : [chevauchement] —su ce que tu pensais ? Un coup de chance ! Marissa : [rit] Honnêtement ? C'est plutôt amusant.
Le résultat ressemble à un vrai dialogue — pas à une narration assemblée.
Ce qui nécessitait plusieurs intervenants, enregistrements et ajustements de timing peut désormais être géré par un seul script. Les tags vous permettent de diriger chaque voix indépendamment dans une seule scène.
Exemple : Jessica : [whispers] Comme ça. Von Fusion : [sarcastically] Oh, eh bien, regardez-vous, Mademoiselle Chique. Jessica : [French accent] C'est spectaculaire, n'est-ce pas ?
Les voix ne font pas que s'alterner — elles interagissent, réagissent et se chevauchent.
Voici quelques tags essentiels pour écrire des dialogues naturels et réactifs :
Ces éléments peuvent être superposés pour un jeu expressif : [frustrated] Tu ne m'écoutes jamais — [interjecting] Parce que tu ne dis jamais ce que tu penses !
Eleven v3 prend en charge une livraison consciente du timing qui permet aux voix de s'interrompre ou de se chevaucher naturellement. C'est essentiel pour l'humour, la tension ou le réalisme.
Dans cet extrait : Marissa : [panicking] Attendez, est-ce qu'on s'écrase ? Je ne sais pas si c'est une fonctionnalité ou un— Chris : [interrupting] Bug ! Marissa : [sighing] Oui, mais honnêtement ? C'est plutôt amusant.
La scène semble vivante car l'interaction est fluide, pas scriptée tour par tour.
Avec Eleven v3, les scènes de dialogue deviennent des performances orchestrées. Vous pouvez construire des conversations entières — avec personnages, timing, émotion et livraison — en utilisant un seul script et un seul modèle.
Pour les conteurs, les scénaristes de jeux et les designers interactifs, cela permet d'écrire des scènes complexes sans frais de production supplémentaires. Vous ne faites pas que scénariser des répliques. Vous dirigez la dynamique du casting.
Les Professional Voice Clones (PVCs) ne sont pas encore entièrement optimisés pour Eleven v3, ce qui peut entraîner une qualité de clone potentiellement inférieure par rapport aux modèles précédents. Pendant cette phase de prévisualisation de recherche, il serait préférable de trouver un Instant Voice Clone (IVC) ou une voix conçue pour votre projet si vous devez utiliser les fonctionnalités de v3. L'optimisation des PVC pour v3 arrive bientôt.
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Supporting 10,000+ research conversations with natural, trustworthy voices
Propulsé par ElevenLabs Agents