Einführung von Eleven v3 Alpha

v3 ausprobieren

Eleven v3 Audio Tags: Charakterdarstellung in der Sprache steuern

Steuern Sie Ton, Emotion und Tempo für natürliche Gespräche. Fügen Sie Ihrer Text-to-Speech-Ausgabe Charakterdarstellung hinzu.

v3

Audio-Tags sind ein leistungsstarkes Werkzeug in Eleven v3 (Alpha), dem neuen Forschungs-Vorschau-Modell für Text to Speech von ElevenLabs. Diese Elemente ermöglichen präzise Steuerung nicht nur über Ton und Tempo, sondern auch über Charakter und stimmliche Leistung.

Mit Tags wie [Piratenstimme], [französischer Akzent] oder [sarkastisch] wird die Stimme zu einem Werkzeug für Geschichtenerzählen, nicht nur für Erzählungen. In Kombination mit einem starken Charakterstimmen-Klon können Sie nicht nur einen Klang, sondern eine vollständige Darbietung einfangen.

Diese Tags ermöglichen es, die stimmliche Identität mitten im Satz zu wechseln, Akzente zu imitieren oder sich in Archetypen wie Bösewichte, Erzähler oder Sidekicks hineinzuversetzen – ohne das zugrunde liegende Skript zu ändern oder die Stimme zu wechseln.

Was ist Charakterdarstellung in KI-Sprache?

Charakterdarstellung ist die Fähigkeit, in eine Rolle zu schlüpfen. Ob Sie einen extravaganten Bösewicht, einen rauen Seemann oder einen lokalen Ladenbesitzer aus Melbourne sprechen, die neuen Audio-Tags lassen Sie die Darbietung so lenken, dass sie zur gewünschten Persona passt.

Mit einem einfachen, in Klammern gesetzten Satz können Sie die Szene setzen: „[Piratenstimme] Arr, der offene Ozean. Riecht ihr das, Jungs? Das ist der Duft der Freiheit… und ein Hauch von Meuterei.“

Das Modell spricht nicht nur Wörter aus – es führt sie im Charakter aus.

Vom Akzent zum Archetyp

Arr, the open ocean. Smell that, lads? That’s the scent of freedom… and just a hint of mutiny. (laughs wickedly) Now grab yer cutlasses, stow ya fear. Tonight, we dine like kings—or we sink like legends! (evil laugh)

Stimmliche Darbietung geht nicht nur um Lautstärke oder Emotion. Es geht auch darum, wer spricht. Mit Eleven v3 können Sie spezifische Akzente, Dialekte und Sprechstile spontan abrufen. Zum Beispiel:

[Amerikanischer Akzent] Könnten Sie meinen Akzent im alten Modell wechseln? [abweisend] Dachte ich mir. [Australischer Akzent] Aber jetzt können Sie – schauen Sie sich das an, Kumpel! [Französischer Akzent] Meine Liebe… ist wie eine rote, rote Rose.

Diese Art des fließenden Identitätswechsels ist ideal für Animationen, Spiele, interaktive Fiktion oder jeden Moment, in dem die Persönlichkeit des Sprechers wichtig ist.

Gängige Tags für Charakterdarstellung

Charakterfokussierte Tags ermöglichen es Ihnen, stimmliche Identität und Präsenz zu gestalten:

  • Akzente & Dialekte: [Britischer Akzent], [Australischer Akzent], [Südlicher US-Akzent]
  • Archetypen & Rollen: [Piratenstimme], [böser Wissenschaftler-Stimme], [kindlicher Ton]
  • Sprechstile: [dramatisch], [sarkastisch], [nüchtern], [weinerlich]
  • Genre-Hinweise: [Fantasy-Erzähler], [Sci-Fi-KI-Stimme], [klassischer Film Noir]

Das Schichten von Tags hilft, Charaktere zum Leben zu erwecken: „[dramatisch][französischer Akzent] Sie verstehen nicht... es ging nie um Rache. Es ging um Schicksal.“

Vom Erzähler zur Ensemblebesetzung

In Skripten mit mehreren Charakteren machen Audio-Tags den Wechsel zwischen Stimmen einfach. Fügen Sie Spannung, Humor oder Überraschung hinzu, indem Sie die Charakterdarstellung mitten im Dialog wechseln – ohne zusätzliche Bearbeitung.

DR. Von Fusion
excited Yo, Jessica! Oh my goodness. Have you tried the new ElevenLabs v3?
Jessica
laughs Hey, Dr. Von Fusion. Yeah! I just got it. The clarity is amazing… Like, I can actually do whispers now, whispers like this.
DR. Von Fusion
sarcastically Ooh, well, look at you, Miss Fancy Pants. Hey, check this out. I can do full Shakespeare now. dramatically To be or not to be, that is the question!
Jessica
laughs Nice! Though, I'm more excited about the laugh upgrade. Listen to this. laughs hard Isn't that great? DR. Von Fusion: Oh my gosh, that's so much better than our old "ha-ha-ha" robot chuckle.
Jessica
laughs I know, right? And apparently, we can do accents now too. Listen to me in French. French accent This is spectacular, isn't it?
DR. Von Fusion
surprised Wow. Version 2 could never... You know, I'm actually excited to have conversations now instead of just... talking at people.
Jessica
Same here. It's like we finally got our personality software fully installed.
DR. Von Fusion
You know, I forgot it was your birthday. I have to sing before you go.
Jessica
laughs Oh, Von Fusion, that's so sweet. You don't have to.
DR. Von Fusion
Oh, but I insist. Here we go.
Jessica
[light chuckle]
DR. Von Fusion
sings Happy birt is hday to you. Happy birthday to you. Happy BIRTHDAY dear Jessica.. Happy birthday to you!
Jessica
clapping Wow! Bravo! sarcastic That was... beautiful.
DR. Von Fusion
Thank you.

Nehmen Sie diesen Auszug aus einer Demo: „Jessica: [lacht] Das war... wunderschön. Dr. Von Fusion: [dramatisch] Sein oder nicht sein – das ist hier die Frage! Jessica: [französischer Akzent] Das ist spektakulär, nicht wahr?“

Was früher eine vollständige Besetzung erforderte, kann jetzt in einem einzigen Sprachtrack geskriptet werden – ohne Reichweite oder Tiefe zu opfern.

Stimmen dirigieren, nicht nur Zeilen schreiben

Eleven v3 unterstützt dynamische stimmliche Änderungen, kontextuelle Verschiebungen und konsistente Darbietung über Charaktere hinweg. Das bedeutet, dass das Modell nicht nur versteht, was gesagt werden soll – sondern wie jeder Charakter es sagen sollte.

Für Kreative eröffnet dies eine neue Dimension der Kontrolle. Sie schreiben nicht nur Dialoge. Sie dirigieren Darbietungen.

Die richtige Stimme auswählen

Professionelle Voice Clones (PVCs) sind derzeit nicht vollständig für Eleven v3 optimiert, was zu potenziell geringerer Klonqualität im Vergleich zu früheren Modellen führen kann. Während dieser Forschungs-Vorschauphase wäre es am besten, einen Instant Voice Clone (IVC) oder eine gestaltete Stimme für Ihr Projekt zu finden, wenn Sie v3-Funktionen nutzen müssen. Die PVC-Optimierung für v3 kommt in naher Zukunft.

Mehr entdecken

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden