
Le Walk brings cities to life with ElevenLabs
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Feinabstimmung von Timing, Rhythmus und Betonung mit Eleven v3 Audio Tags. Verwandeln Sie flache Wiedergabe in dynamische, performative Inhalte.
Großartige Sprache hängt nicht nur davon ab, was gesagt wird — sondern wie es gesagt wird. Mit Eleven v3 Audio Tags erhalten Sie eine fein abgestimmte Kontrolle über Timing, Rhythmus und Betonung, sodass Sie das Tempo einer Zeile präzise gestalten können.
Mit Tags wie [pause], [rushed], [stammers] oder [drawn out] können Sie anpassen, wie jede Satz emotional und rhythmisch wirkt. Diese Kontrolle verwandelt flache Wiedergabe in Performance.
Steuerung der Wiedergabe ist die Fähigkeit, den Fluss der Sprache zu lenken — wie schnell sie sich bewegt, wo sie pausiert, wann sie betont. Es verleiht einer Zeile Dramatik, Lässigkeit, Spannung oder Komik.
Mit Eleven v3 ist die Wiedergabe nicht auf das Standardtempo beschränkt. Sie können das Tempo für Spannung verlangsamen, für Dringlichkeit beschleunigen oder für Humor Rhythmus hinzufügen – direkt im Skript.
Beispiel: "Okay, also ich habe endlich Level 42 von diesem Spiel geschafft, das ich vor einem Monat aufgeben wollte. [lacht] Und dann der Endgegner... war einfach... [kichert] ein Kaninchen. [großes Lachen] Ich konnte es nicht tun. Es war zu süß."
Hier formen Tags das Tempo und Timing — und das lässt die Zeile wirken.
Tags geben Ihnen Zugang zu den subtilen Hinweisen, die Menschen nutzen, um Sprache natürlich zu gestalten:
Beispiel: "[drawn out] Alsoooo... Sie sagen... [misstrauischer Ton] Sie haben das letzte Stück nicht gegessen?"
Diese Tags geben Ihnen die vollständige Kontrolle darüber, wie eine Stimme sich anfühlt in Bewegung.
Ändert sich die Art und Weise, wie eine Zeile geliefert wird, ändert sich auch ihre Interpretation.
Gleiche Worte. Unterschiedliche Bedeutung. Mit Steuerung der Wiedergabe entsteht der Ton nicht durch Wortwahl, sondern durch Timing und Absicht.
Sie können auf Wiedergabe fokussierte Tags mit emotionalen oder charakterlichen Hinweisen kombinieren, um ganze Szenen zu gestalten.
Beispiel: [zögernd][nervös] Ich... ich bin mir nicht sicher, ob das funktionieren wird. [schluckt] Aber versuchen wir es trotzdem.
Oder: [flüsternd][Pause] Haben Sie das gehört? [eilig] Verstecken! Jetzt!
Es ist diese Mischung aus Rhythmus und Reaktion, die Darbietungen glaubwürdig macht.
Eleven v3 verwandelt das Skript in eine Partitur — und die Steuerung der Wiedergabe ist, wie Sie es dirigieren. Ob Sie Tutorials, Monologe oder Pointen schreiben, Audio Tags ermöglichen es Ihnen, die Wiedergabe mit Bild-für-Bild-Präzision zu steuern.
Für Kreative bedeutet dies vollständige Kontrolle darüber, wie sich eine Zeile entfaltet. Sie schreiben nicht nur, was passiert. Sie bestimmen das Tempo.
Professionelle Voice Clones (PVCs) sind derzeit nicht vollständig für Eleven v3 optimiert, was zu einer potenziell geringeren Klonqualität im Vergleich zu früheren Modellen führen kann. Während dieser Forschungs-Vorschauphase wäre es am besten, einen Instant Voice Clone (IVC) oder eine gestaltete Stimme für Ihr Projekt zu finden, wenn Sie v3-Funktionen nutzen möchten. Die Optimierung von PVC für v3 kommt in naher Zukunft.
Demand for digital tour guides rises with 10k+ tours taken and an average of 53 minutes listening time per session
Supporting 10,000+ research conversations with natural, trustworthy voices
Bereitgestellt von ElevenLabs Agenten