Eleven v3 Audio Tags : Donner vie aux dialogues multi-personnages

Créez des dialogues dynamiques avec plusieurs personnages grâce à Eleven v3 Audio Tags. Scénarisez des voix qui se chevauchent, des interruptions et des changements émotionnels pour des conversations IA naturelles et humaines.

v3

Les conversations font avancer l'histoire. Avec Eleven v3 Audio Tags, vous pouvez maintenant écrire des scènes avec des voix qui se chevauchent, des échanges rapides et des interactions émotionnelles — le tout réalisé par un seul modèle.

En combinant des tags comme [interrupting], [overlapping] ou [laughs], vous pouvez créer un dialogue naturaliste qui coule comme une conversation humaine — avec des interruptions, des changements de ton et des réactions spontanées.

Ce n'est pas juste un discours ligne par ligne. C'est une performance multi-personnages.

Qu'est-ce qu'un dialogue multi-personnages dans l'IA ?

Background
Background

Le dialogue multi-personnages, c'est quand un modèle de voix joue plusieurs rôles distincts dans la même scène. Chaque personnage parle avec un style, un ton ou un rythme différent — parfois même en interrompant ou en parlant en même temps.

Avec Eleven v3, vous pouvez écrire ce script directement : Marissa : [commence à parler] Alors je pensais que nous pourrions— Chris : [interrompt] —tester nos nouvelles fonctionnalités de synchronisation ? Marissa : [surprise] Exactement ! Comment as-tu— Chris : [chevauchement] —su ce que tu pensais ? Un coup de chance ! Marissa : [rit] Honnêtement ? C'est plutôt amusant.

Le résultat ressemble à un vrai dialogue — pas à une narration assemblée.

De l'interprétation vocale à l'interaction

Ce qui nécessitait plusieurs intervenants, enregistrements et ajustements de timing peut désormais être géré par un seul script. Les tags vous permettent de diriger chaque voix indépendamment dans une seule scène.

Exemple : Jessica : [whispers] Comme ça. Von Fusion : [sarcastically] Oh, eh bien, regardez-vous, Mademoiselle Chique. Jessica : [French accent] C'est spectaculaire, n'est-ce pas ?

Les voix ne font pas que s'alterner — elles interagissent, réagissent et se chevauchent.

Tags courants pour le contrôle multi-personnages

Voici quelques tags essentiels pour écrire des dialogues naturels et réactifs :

  • Indices de prise de parole : [interrupting], [overlapping], [cuts in]
  • Changements émotionnels : [excited], [annoyed], [flustered], [casual]
  • Flux rythmique : [fast-paced], [hesitates], [pause], [drawn out]
  • Changement d'identité : [childlike tone], [deep voice], [pirate voice], [robotic tone]

Ces éléments peuvent être superposés pour un jeu expressif : [frustrated] Tu ne m'écoutes jamais — [interjecting] Parce que tu ne dis jamais ce que tu penses !

Chevauchement, rythme et présence

Eleven v3 prend en charge une livraison consciente du timing qui permet aux voix de s'interrompre ou de se chevaucher naturellement. C'est essentiel pour l'humour, la tension ou le réalisme.

Dans cet extrait : Marissa : [panicking] Attendez, est-ce qu'on s'écrase ? Je ne sais pas si c'est une fonctionnalité ou un— Chris : [interrupting] Bug ! Marissa : [sighing] Oui, mais honnêtement ? C'est plutôt amusant.

La scène semble vivante car l'interaction est fluide, pas scriptée tour par tour.

Diriger des scènes, pas seulement des phrases

Avec Eleven v3, les scènes de dialogue deviennent des performances orchestrées. Vous pouvez construire des conversations entières — avec personnages, timing, émotion et livraison — en utilisant un seul script et un seul modèle.

Pour les conteurs, les scénaristes de jeux et les designers interactifs, cela permet d'écrire des scènes complexes sans frais de production supplémentaires. Vous ne faites pas que scénariser des répliques. Vous dirigez la dynamique du casting.

Choisir la bonne voix

Les Professional Voice Clones (PVCs) ne sont pas encore entièrement optimisés pour Eleven v3, ce qui peut entraîner une qualité de clone potentiellement inférieure par rapport aux modèles précédents. Pendant cette phase de prévisualisation de recherche, il serait préférable de trouver un Instant Voice Clone (IVC) ou une voix conçue pour votre projet si vous devez utiliser les fonctionnalités de v3. L'optimisation des PVC pour v3 arrive bientôt.

Découvrez les articles de l'équipe ElevenLabs

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter