Présentation de Eleven v3 Alpha

Essayez v3

Eleven v3 Audio Tags : Diriger la performance des personnages dans le discours

Contrôlez le ton, l'émotion et le rythme pour une conversation naturelle. Ajoutez une performance de personnage à votre Text to Speech.

v3

Les Audio Tags sont un outil puissant dans Eleven v3 (alpha), le nouveau modèle de recherche Text to Speech d'ElevenLabs. Ces éléments permettent un contrôle précis non seulement du ton et du rythme, mais aussi du personnage et de la performance vocale.

Avec des tags comme [voix de pirate], [accent français] ou [sarcastiquement], la voix devient un outil de narration, pas seulement de narration. Associé à un clone de voix de personnage fort, vous pouvez capturer non seulement un son, mais une performance complète.

Ces tags permettent de changer d'identité vocale en cours de phrase, d'imiter des accents ou d'adopter des archétypes comme les méchants, les narrateurs ou les acolytes — sans modifier le script sous-jacent ou changer de voix.

Qu'est-ce que la performance de personnage dans la parole IA ?

La performance de personnage est la capacité à entrer dans un rôle. Que vous donniez la voix à un méchant flamboyant, un capitaine de mer bourru ou un commerçant local de Melbourne, les nouveaux Audio Tags vous permettent de guider la livraison pour correspondre au personnage que vous souhaitez transmettre.

Avec une simple phrase entre crochets, vous pouvez planter le décor : “[voix de pirate] Arr, l'océan ouvert. Vous sentez ça, les gars ? C'est le parfum de la liberté… et juste une pointe de mutinerie.”

Le modèle ne se contente pas de prononcer des mots — il les interprète en personnage.

De l'accent à l'archétype

Arr, the open ocean. Smell that, lads? That’s the scent of freedom… and just a hint of mutiny. (laughs wickedly) Now grab yer cutlasses, stow ya fear. Tonight, we dine like kings—or we sink like legends! (evil laugh)

La performance vocale ne concerne pas seulement le volume ou l'émotion. Il s'agit aussi de savoir qui parle. Avec Eleven v3, vous pouvez déclencher des accents, dialectes et styles de parole spécifiques à la volée. Par exemple :

[accent américain] Pourriez-vous changer mon accent dans l'ancien modèle ? [dédaigneux] Je ne pensais pas. [accent australien] Mais maintenant vous pouvez — regardez ça, mate ! [accent français] Mon amour… eez comme une rose rouge, rouge.

Ce type de changement d'identité fluide est idéal pour l'animation, les jeux, la fiction interactive ou tout moment où la personnalité du locuteur compte.

Tags courants pour la performance de personnage

Les tags axés sur le personnage vous permettent de façonner l'identité et la présence vocale :

  • Accents et dialectes : [accent britannique], [accent australien], [accent du sud des États-Unis]
  • Archétypes et rôles : [voix de pirate], [voix de scientifique maléfique], [ton enfantin]
  • Styles de parole : [dramatique], [sarcastiquement], [de manière factuelle], [pleurnichard]
  • Indications de genre : [narrateur de fantasy], [voix IA de science-fiction], [film noir classique]

Superposer des tags aide à donner vie aux personnages : “[dramatique][accent français] Vous ne comprenez pas... ce n'était jamais une question de vengeance. C'était une question de destin.”

Du narrateur à la distribution

Dans les scripts à plusieurs personnages, les Audio Tags facilitent le passage d'une voix à l'autre. Ajoutez de la tension, de l'humour ou de la surprise simplement en changeant la performance du personnage en cours de dialogue — sans montage supplémentaire.

DR. Von Fusion
excited Yo, Jessica! Oh my goodness. Have you tried the new ElevenLabs v3?
Jessica
laughs Hey, Dr. Von Fusion. Yeah! I just got it. The clarity is amazing… Like, I can actually do whispers now, whispers like this.
DR. Von Fusion
sarcastically Ooh, well, look at you, Miss Fancy Pants. Hey, check this out. I can do full Shakespeare now. dramatically To be or not to be, that is the question!
Jessica
laughs Nice! Though, I'm more excited about the laugh upgrade. Listen to this. laughs hard Isn't that great? DR. Von Fusion: Oh my gosh, that's so much better than our old "ha-ha-ha" robot chuckle.
Jessica
laughs I know, right? And apparently, we can do accents now too. Listen to me in French. French accent This is spectacular, isn't it?
DR. Von Fusion
surprised Wow. Version 2 could never... You know, I'm actually excited to have conversations now instead of just... talking at people.
Jessica
Same here. It's like we finally got our personality software fully installed.
DR. Von Fusion
You know, I forgot it was your birthday. I have to sing before you go.
Jessica
laughs Oh, Von Fusion, that's so sweet. You don't have to.
DR. Von Fusion
Oh, but I insist. Here we go.
Jessica
[light chuckle]
DR. Von Fusion
sings Happy birt is hday to you. Happy birthday to you. Happy BIRTHDAY dear Jessica.. Happy birthday to you!
Jessica
clapping Wow! Bravo! sarcastic That was... beautiful.
DR. Von Fusion
Thank you.

Prenez cet extrait d'une démo : "Jessica : [rit] C'était... magnifique. Dr. Von Fusion : [dramatique] Être ou ne pas être — telle est la question ! Jessica : [accent français] C'est spectaculaire, n'est-ce pas ?"

Ce qui nécessitait autrefois une distribution complète peut maintenant être scénarisé sur une seule piste vocale — sans sacrifier la portée ou la profondeur.

Diriger les voix, pas seulement écrire des lignes

Eleven v3 prend en charge les changements vocaux dynamiques, les changements contextuels et une livraison cohérente à travers les personnages. Cela signifie que le modèle comprend non seulement quoi dire — mais comment chaque personnage doit le dire.

Pour les créateurs, cela ouvre une nouvelle dimension de contrôle. Vous ne faites pas que scénariser des dialogues. Vous dirigez des performances.

Sélectionner la bonne voix

Les Professional Voice Clones (PVCs) ne sont actuellement pas entièrement optimisés pour Eleven v3, ce qui peut entraîner une qualité de clone potentiellement inférieure par rapport aux modèles précédents. Pendant cette phase de prévisualisation de recherche, il serait préférable de trouver un Instant Voice Clone (IVC) ou une voix conçue pour votre projet si vous devez utiliser les fonctionnalités de v3. L'optimisation des PVC pour v3 arrive bientôt.

En voir plus

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter