Présentation de Eleven v3 Alpha

Essayez v3

Que sont les balises audio Eleven v3 — et pourquoi elles sont importantes

Les balises audio d'ElevenLabs contrôlent l'émotion, le rythme et les effets sonores des voix IA.

Audio tags

Avec la sortie de Eleven v3, l'audio prompting est devenu une compétence essentielle. Au lieu de taper ou coller les mots que vous voulez que la voix IA dise, vous pouvez maintenant utiliser une nouvelle capacité — Tags Audio — pour tout contrôler, de l'émotion à la livraison.

Eleven v3 est une version alpha aperçu de recherche du nouveau modèle. Cela nécessite plus d'ingénierie de promptque les modèles précédents — mais les générations sont époustouflantes.

Les Tags Audio d'ElevenLabs sont des mots entre crochets que le nouveau modèle Eleven v3 peut interpréter et utiliser pour diriger l'action audible. Ils peuvent être [excité], [chuchote], et [soupire] jusqu'à [coup de feu], [applaudissements] et [explosion].

Les Tags Audio vous permettent de façonner le son des voix IA, y compris les indices non verbaux comme le ton, les pauses et le rythme. Que vous créiez des livres audio immersifs, des personnages interactifs ou des médias axés sur le dialogue, ces outils simples au niveau du script vous donnent un contrôle précis sur l'émotion et la livraison.

Diriger la performance avec les Tags Audio

Vous pouvez placer des Tags Audio n'importe où dans votre script pour façonner la livraison en temps réel. Vous pouvez également utiliser des combinaisons de tags dans un script ou même une phrase. Les tags se répartissent en catégories principales :

Émotions

Ces tags peuvent vous aider à définir le ton émotionnel de la voix — qu'il soit sombre, intense ou joyeux. Par exemple, vous pourriez utiliser une ou une combinaison de [triste], [en colère], [joyeusement] et [chagriné].

Background
sorrowful I couldn't sleep that night. The air was too still, and the moonlight kept sliding through the blinds like it was trying to tell me something. quietly And suddenly, that's when I saw it.
Background
Okay, you are not going to believe this. You know how I've been totally stuck on that short story, like staring at the screen for HOURS, just... nothing? sigh I was seriously about to just trash the whole thing - start over - give up probably, but then laughs last night I was just doodling, not even thinking about it, right? And this one little phrase popped into my head, just completely out of the blue, and it wasn't even for the story initially. But then I typed it out just to see, and it was like the FLOODGATES opened. Suddenly I knew exactly where the character needed to go, what the ending had to be. It all just - clicked. sigh I stayed up till like 3:00 AM, just typing like a maniac, didn't even stop for coffee. light chuckle And it's, it's GOOD, like really good. It feels so complete now, you know, like it finally has a soul. I am so incredibly pumped to finish editing it now. It went from feeling like a chore to feeling like MAGIC. Seriously, I'm still buzzing.

Direction de la livraison

Il s'agit davantage du ton et de la performance. Vous pouvez utiliser ces tags pour ajuster le volume et l'énergie pour des scènes nécessitant retenue ou force. Exemples : [chuchote], [crie] et même [accent x].

Background
Could you switch my accent in the old model? dismissive didn't think so. cheeky but you can now! so, Check this out...In just a sec, I'm gonna to speak with a different accent.. and just between you and me whispers I don't really know how. chuckles but ok.. first let's change it up... Australian accent so that I can fit in with the locals in Melbourne when I visit next month! laughs hard Woooo! yeah man, this - is - sick. Ok, let's try a different one - see if you can guess... strong French accent My love... eez like a red, red rose..
Background
Marissa
starting to speak So I was thinking we could—
Chris
jumping in —test our new timing features?
Marissa
surprised Exactly! How did you—
Chris
overlapping —know what you were thinking? Lucky guess! Sorry, go ahead.
Marissa
cautiously Okay, so if we both try to talk at the same time—
Chris
—we'll probably crash the system!
Marissa
panicking Wait, are we crashing? I can't tell if this is a feature or a—
Chris
interrupting Bug! ...Did I just cut you off again?
Marissa
sighing Yes, but honestly? This is kind of fun.

Réactions humaines

Le véritable discours naturel inclut des réactions. Par exemple, vous pouvez utiliser cela pour ajouter du réalisme en intégrant des moments naturels et non scriptés dans le discours. Par exemple : [rit], [se racle la gorge] et [soupire].

Background
We're off under the lights here for this semi-final clash, the stadium buzzing with anticipation. ElevenLabs United in their iconic black and white shirts, pushing forward with intent straight from the opening whistle. excited The ball is zipped out wide, early attack here. Driving down the wing, pace to Bernie, shouting skips past one, skips past two! Oh, this is beautiful. One-on-one with the full-back, cuts inside—oh, that's a lovely bit of footwork!!! PURE MAGIC on the pitch! ElevenLabs on top form tonight!
Background
Oh my God. laughs You guys, like no joke, I just tried this TTS thing and it was, like, weirdly emotional. Like it literally said, "Hi," and I was, like, on the verge of tears. laughs I don't even cry, okay? I'm a Capricorn.

Construit sur un modèle plus expressif

Sous-tendant ces fonctionnalités, la nouvelle architecture derrière v3. Le modèle comprend le contexte du texte à un niveau plus profond, ce qui signifie qu'il peut suivre les indices émotionnels, les changements de ton et les transitions de locuteur plus naturellement. Combiné avec les Tags Audio, cela permet une expressivité plus grande qu'auparavant dans le TTS.

Vous pouvez maintenant aussi créer des dialogues multi-locuteurs qui semblent spontanés — gérant les interruptions, les changements d'humeur et les nuances conversationnelles avec un minimum de sollicitation.

Disponible maintenant

Les clones vocaux professionnels (PVC) ne sont actuellement pas entièrement optimisés pour Eleven v3, ce qui peut entraîner une qualité de clone potentiellement inférieure par rapport aux modèles précédents. Pendant cette phase de prévisualisation de recherche, il serait préférable de trouver un clone vocal instantané (IVC) ou une voix conçue pour votre projet si vous devez utiliser les fonctionnalités de v3. L'optimisation des PVC pour v3 arrive bientôt.80% off until the end of June. Public API for Eleven v3 (alpha) is coming soon. For early access, please contact sales. Whether you’re experimenting or deploying at scale, now’s the time to explore what’s possible.

Découvrez les articles de l'équipe ElevenLabs

ElevenLabs

Créez avec l'audio AI de la plus haute qualité.

Se lancer gratuitement

Vous avez déjà un compte ? Se connecter