Einführung von Eleven v3 Alpha

v3 ausprobieren

Was sind Eleven v3 Audio-Tags — und warum sind sie wichtig

Die Audio-Tags von ElevenLabs steuern die Emotion, das Tempo und die Soundeffekte der KI-Stimme.

Audio tags

Mit der Veröffentlichung von Eleven v3, ist Audio-Prompting zu einer wichtigen Fähigkeit geworden. Anstatt die gewünschten Worte einzugeben oder einzufügen, können Sie jetzt eine neue Funktion nutzen — Audio-Tags — um alles von Emotionen bis zur Darbietung zu steuern.

Eleven v3 ist eine Alpha-Version Forschungsvorschau des neuen Modells. Es erfordert mehr Prompt-Engineering als frühere Modelle — aber die Ergebnisse sind beeindruckend.

ElevenLabs Audio-Tags sind Wörter in eckigen Klammern, die das neue Eleven v3 Modell interpretieren und zur Steuerung der hörbaren Aktion verwenden kann. Sie können alles sein, von [aufgeregt], [flüstert] und [seufzt] bis hin zu [Schuss], [Applaus] und [Explosion].

Audio-Tags ermöglichen es Ihnen, den Klang von KI-Stimmen zu gestalten, einschließlich nonverbaler Hinweise wie Ton, Pausen und Tempo. Ob Sie immersive Hörbücher, interaktive Charaktere oder dialoggesteuerte Medien erstellen, diese einfachen Skript-Tools geben Ihnen präzise Kontrolle über Emotionen und Darbietung.

Leistung mit Audio-Tags steuern

Sie können Audio-Tags überall in Ihrem Skript platzieren, um die Darbietung in Echtzeit zu gestalten. Sie können auch Kombinationen von Tags innerhalb eines Skripts oder sogar eines Satzes verwenden. Tags fallen in Kernkategorien:

Emotionen

Diese Tags können Ihnen helfen, den emotionalen Ton der Stimme festzulegen — ob ernst, intensiv oder fröhlich. Zum Beispiel könnten Sie eine oder eine Kombination von [traurig], [wütend], [fröhlich] und [betrübt] verwenden.

Background
sorrowful I couldn't sleep that night. The air was too still, and the moonlight kept sliding through the blinds like it was trying to tell me something. quietly And suddenly, that's when I saw it.
Background
Okay, you are not going to believe this. You know how I've been totally stuck on that short story, like staring at the screen for HOURS, just... nothing? sigh I was seriously about to just trash the whole thing - start over - give up probably, but then laughs last night I was just doodling, not even thinking about it, right? And this one little phrase popped into my head, just completely out of the blue, and it wasn't even for the story initially. But then I typed it out just to see, and it was like the FLOODGATES opened. Suddenly I knew exactly where the character needed to go, what the ending had to be. It all just - clicked. sigh I stayed up till like 3:00 AM, just typing like a maniac, didn't even stop for coffee. light chuckle And it's, it's GOOD, like really good. It feels so complete now, you know, like it finally has a soul. I am so incredibly pumped to finish editing it now. It went from feeling like a chore to feeling like MAGIC. Seriously, I'm still buzzing.

Darbietungsrichtung

Diese beziehen sich mehr auf den Ton und die Darbietung. Sie können diese Tags verwenden, um Lautstärke und Energie für Szenen anzupassen, die Zurückhaltung oder Kraft erfordern. Beispiele sind: [flüstert], [schreit] und sogar [x Akzent].

Background
Could you switch my accent in the old model? dismissive didn't think so. cheeky but you can now! so, Check this out...In just a sec, I'm gonna to speak with a different accent.. and just between you and me whispers I don't really know how. chuckles but ok.. first let's change it up... Australian accent so that I can fit in with the locals in Melbourne when I visit next month! laughs hard Woooo! yeah man, this - is - sick. Ok, let's try a different one - see if you can guess... strong French accent My love... eez like a red, red rose..
Background
Marissa
starting to speak So I was thinking we could—
Chris
jumping in —test our new timing features?
Marissa
surprised Exactly! How did you—
Chris
overlapping —know what you were thinking? Lucky guess! Sorry, go ahead.
Marissa
cautiously Okay, so if we both try to talk at the same time—
Chris
—we'll probably crash the system!
Marissa
panicking Wait, are we crashing? I can't tell if this is a feature or a—
Chris
interrupting Bug! ...Did I just cut you off again?
Marissa
sighing Yes, but honestly? This is kind of fun.

Menschliche Reaktionen

Echte natürliche Sprache umfasst Reaktionen. Zum Beispiel können Sie dies verwenden, um Realismus hinzuzufügen, indem Sie natürliche, ungeskriptete Momente in die Sprache einbetten. Zum Beispiel: [lacht], [räuspert sich] und [seufzt].

Background
We're off under the lights here for this semi-final clash, the stadium buzzing with anticipation. ElevenLabs United in their iconic black and white shirts, pushing forward with intent straight from the opening whistle. excited The ball is zipped out wide, early attack here. Driving down the wing, pace to Bernie, shouting skips past one, skips past two! Oh, this is beautiful. One-on-one with the full-back, cuts inside—oh, that's a lovely bit of footwork!!! PURE MAGIC on the pitch! ElevenLabs on top form tonight!
Background
Oh my God. laughs You guys, like no joke, I just tried this TTS thing and it was, like, weirdly emotional. Like it literally said, "Hi," and I was, like, on the verge of tears. laughs I don't even cry, okay? I'm a Capricorn.

Auf einem ausdrucksstärkeren Modell aufgebaut

Diese Funktionen basieren auf der neuen Architektur hinter v3. Das Modell versteht den Textkontext auf einer tieferen Ebene, was bedeutet, dass es emotionale Hinweise, Tonwechsel und Sprecherübergänge natürlicher folgen kann. In Kombination mit Audio-Tags wird eine größere Ausdruckskraft freigesetzt, als bisher im TTS möglich war.

Sie können jetzt auch Mehrsprecher-Dialoge erstellen, die spontan wirken — Unterbrechungen handhaben, Stimmungen wechseln und Gesprächsnuancen mit minimalem Anstoß bewältigen.

Jetzt verfügbar

Professionelle Voice Clones (PVCs) sind derzeit nicht vollständig für Eleven v3 optimiert, was zu einer potenziell geringeren Klonqualität im Vergleich zu früheren Modellen führen kann. In dieser Forschungs-Vorschauphase wäre es am besten, einen Instant Voice Clone (IVC) oder eine gestaltete Stimme für Ihr Projekt zu finden, wenn Sie v3-Funktionen nutzen müssen. Die PVC-Optimierung für v3 kommt in naher Zukunft.80% off until the end of June. Public API for Eleven v3 (alpha) is coming soon. For early access, please contact sales. Whether you’re experimenting or deploying at scale, now’s the time to explore what’s possible.

Entdecken Sie Artikel des ElevenLabs-Teams

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden