Eleven v3 Audio Tags: Präzise Steuerung der KI-Sprachwiedergabe

Feinabstimmung von Timing, Rhythmus und Betonung mit Eleven v3 Audio Tags. Verwandeln Sie flache Wiedergabe in dynamische, performative Inhalte.

v3

Großartige Sprache hängt nicht nur davon ab, was gesagt wird — sondern wie es gesagt wird. Mit Eleven v3 Audio Tags erhalten Sie eine fein abgestimmte Kontrolle über Timing, Rhythmus und Betonung, sodass Sie das Tempo einer Zeile präzise gestalten können.

Mit Tags wie [pause], [rushed], [stammers] oder [drawn out] können Sie anpassen, wie jede Satz emotional und rhythmisch wirkt. Diese Kontrolle verwandelt flache Wiedergabe in Performance.

Was bedeutet Steuerung der Wiedergabe in KI-Sprache?

Steuerung der Wiedergabe ist die Fähigkeit, den Fluss der Sprache zu lenken — wie schnell sie sich bewegt, wo sie pausiert, wann sie betont. Es verleiht einer Zeile Dramatik, Lässigkeit, Spannung oder Komik.

Mit Eleven v3 ist die Wiedergabe nicht auf das Standardtempo beschränkt. Sie können das Tempo für Spannung verlangsamen, für Dringlichkeit beschleunigen oder für Humor Rhythmus hinzufügen – direkt im Skript.

Background

Beispiel: "Okay, also ich habe endlich Level 42 von diesem Spiel geschafft, das ich vor einem Monat aufgeben wollte. [lacht] Und dann der Endgegner... war einfach... [kichert] ein Kaninchen. [großes Lachen] Ich konnte es nicht tun. Es war zu süß."

Hier formen Tags das Tempo und Timing — und das lässt die Zeile wirken.

Kontrolle von Timing, Tempo und Präsenz

Tags geben Ihnen Zugang zu den subtilen Hinweisen, die Menschen nutzen, um Sprache natürlich zu gestalten:

  • Pausen & Unterbrechungen: [pause], [breathes], [continues after a beat]
  • Geschwindigkeits-Hinweise: [rushed], [slows down], [deliberate], [rapid-fire]
  • Zögern & Rhythmus: [stammers], [drawn out], [repeats], [timidly]
  • Betonung: [emphasized], [stress on next word], [understated]

Beispiel: "[drawn out] Alsoooo... Sie sagen... [misstrauischer Ton] Sie haben das letzte Stück nicht gegessen?"

Diese Tags geben Ihnen die vollständige Kontrolle darüber, wie eine Stimme sich anfühlt in Bewegung.

Tempo für Ton und Bedeutung

Background

Ändert sich die Art und Weise, wie eine Zeile geliefert wird, ändert sich auch ihre Interpretation.

Vergleichen Sie:

  • Mir geht es gut.
  • [flach] Mir geht es gut.
  • [leise, nach einer Pause] Mir geht es... gut.
  • [wütend, genervt] Mir geht es GUT!
  • [fragend] Sind Sie [Pause] sicher, dass es Ihnen gut geht?
  • Mir geht es gut. [Pause] wirklich!

Gleiche Worte. Unterschiedliche Bedeutung. Mit Steuerung der Wiedergabe entsteht der Ton nicht durch Wortwahl, sondern durch Timing und Absicht.

Tag-Kombinationen, die den Moment definieren

Background

Sie können auf Wiedergabe fokussierte Tags mit emotionalen oder charakterlichen Hinweisen kombinieren, um ganze Szenen zu gestalten.

Beispiel: [zögernd][nervös] Ich... ich bin mir nicht sicher, ob das funktionieren wird. [schluckt] Aber versuchen wir es trotzdem.

Oder: [flüsternd][Pause] Haben Sie das gehört? [eilig] Verstecken! Jetzt!

Es ist diese Mischung aus Rhythmus und Reaktion, die Darbietungen glaubwürdig macht.

Tempo lenken, nicht nur Text

Eleven v3 verwandelt das Skript in eine Partitur — und die Steuerung der Wiedergabe ist, wie Sie es dirigieren. Ob Sie Tutorials, Monologe oder Pointen schreiben, Audio Tags ermöglichen es Ihnen, die Wiedergabe mit Bild-für-Bild-Präzision zu steuern.

Für Kreative bedeutet dies vollständige Kontrolle darüber, wie sich eine Zeile entfaltet. Sie schreiben nicht nur, was passiert. Sie bestimmen das Tempo.

Die richtige Stimme auswählen

Professionelle Voice Clones (PVCs) sind derzeit nicht vollständig für Eleven v3 optimiert, was zu einer potenziell geringeren Klonqualität im Vergleich zu früheren Modellen führen kann. Während dieser Forschungs-Vorschauphase wäre es am besten, einen Instant Voice Clone (IVC) oder eine gestaltete Stimme für Ihr Projekt zu finden, wenn Sie v3-Funktionen nutzen möchten. Die Optimierung von PVC für v3 kommt in naher Zukunft.

Entdecken Sie Artikel des ElevenLabs-Teams

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden