Wie funktioniert der 80%-Rabatt für Eleven v3?

Eleven v3 ist bis Ende Juni 2025 für Self-Service-Nutzer, die es über die UI verwenden, um 80 % reduziert.

Wie wurden die Beispiele im Video und auf der Website erstellt?

Sie wurden ausschließlich mit dem Eleven v3 Modell erzeugt.

Wie funktioniert die Dialoggenerierung?

Text zu Dialog verbindet mehrere Stimmen zu einer nahtlosen Interaktion. Durch abgestimmte Prosodie, emotionale Bandbreite und die Nutzung von Audiotags ermöglicht Text zu Dialog überzeugende Gespräche.

Ist das über die API verfügbar?

Die öffentliche API für Eleven v3 (Alpha) erscheint in Kürze. Für frühen Zugang bitte Vertrieb kontaktieren .

Direkt zum Inhalt

Anmelden Registrieren

Blog Forschung

Vorstellung von Eleven v3 (Alpha)

Zuletzt aktualisiert 18. Feb. 2026 • 7 Minuten Lesezeit

Piotr Dabkowski, Co-Founder, Research,

Mati Staniszewski, Co-founder

Das ausdrucksstärkste Text-zu-Sprache-Modell

Mehr erfahren Vertrieb kontaktieren Eleven v3 Prompting v3

Wir stellen Eleven v3 (Alpha) vor – das ausdrucksstärkste Text-zu-Sprache-Modell.

Eleven v3 ist nicht mehr in der Alpha-Phase und jetzt allgemein verfügbar.

über 70 Sprachen
Mehrsprecher-Dialog
Audiotags wie [excited], [whispers] und [sighs]

70+ Sprachen erfordert mehr Prompt Engineering als frühere Modelle – aber die Ergebnisse sind beeindruckend.

Wenn Sie an Videos, Hörbüchern oder Medientools arbeiten, eröffnet dies neue Ausdrucksmöglichkeiten. Für Echtzeit- und Gesprächsanwendungen empfehlen wir weiterhin v2.5 Turbo oder Flash. Eine Echtzeit-Version von v3 ist in Entwicklung.

Wenn Sie an Videos, Hörbüchern oder Medientools arbeiten, eröffnet das neue Ausdrucksmöglichkeiten. Für Echtzeit- und Gesprächsanwendungen empfehlen wir weiterhin v2.5 Turbo oder Flash. Eine Echtzeit-Version von v3 ist in Entwicklung.API.

Warum wir v3 entwickelt haben

Warum wir v3 entwickelt habenAusdrucksstärke. Stärkere Emotionen, Gesprächsunterbrechungen und glaubwürdige Dialoge waren schwer umzusetzen.

Seit dem Start von Multilingual v2 wird Voice-KI in Film, Spieleentwicklung, Bildung und Barrierefreiheit eingesetzt. Die größte Einschränkung war jedoch nicht die Klangqualität, sondern die

Eleven v3 schließt diese Lücke. Das Modell wurde von Grund auf entwickelt, um Stimmen zu erzeugen, die seufzen, flüstern, lachen und reagieren – für Sprache, die wirklich lebendig wirkt.

Feature	What it unlocks
Audio tags	Inline control of tone, emotion, and non-verbal reactions
Dialogue mode	Multi-speaker conversations with natural pacing and interruptions
70+ languages	Full coverage of high-demand global languages
Deeper text understanding	Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Audiotags verwenden

Audio-Tags verwendenPrompting-Guide für v3 in der Dokumentation.

Audio-Tags werden direkt im Skript eingesetzt und mit eckigen Klammern in Kleinbuchstaben geschrieben. Mehr zu Audio-Tags finden Sie in unserem

Professional Voice Clones (PVCs) sind derzeit noch nicht vollständig für Eleven v3 optimiert, was zu geringerer Klonqualität im Vergleich zu früheren Modellen führen kann. Während dieser Forschungsphase empfiehlt es sich, für v3-Funktionen einen Instant Voice Clone (IVC) oder eine gestaltete Stimme zu nutzen. Die Optimierung von PVCs für v3 folgt in Kürze.

1“[happily][shouts] We did it! [laughs].”

Mehrsprecher-Dialoge erstellen

Mehrsprecher-Dialoge gestaltenText-zu-Dialog-API-Endpunkt. Geben Sie ein strukturiertes Array von JSON-Objekten an – jedes steht für einen Sprecherwechsel – und das Modell erzeugt eine zusammenhängende, überlappende Audiodatei:

1[
2  {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
3  {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
4  {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
5]
6

Der Endpunkt steuert automatisch Sprecherwechsel, emotionale Übergänge und Unterbrechungen.

Der Endpunkt steuert Sprecherwechsel, Emotionen und Unterbrechungen automatisch.hier.

v3 is our most expressive model

Preise und Verfügbarkeit

Plan	Launch promo	At the end of June
UI (self-serve)	80% off (~5× cheaper)	Same as Multilingual V2
UI (enterprise)	80% off business plan pricing	Business plan pricing

So aktivieren Sie v3:

Nutzen Sie den Modell-Auswahl und wählen Sie Eleven v3 (Alpha)

API-Zugang und Unterstützung im Studio folgen in Kürze. Für frühen Zugang bitte Vertrieb kontaktieren.

API-Zugang und Studio-Unterstützung folgen in Kürze. Für frühen Zugang

Wann Sie v3 nicht verwenden sollten

Eleven v3 (Alpha) erfordert mehr Prompt Engineering als unsere bisherigen Modelle. Die Ergebnisse sind beeindruckend, aber Zuverlässigkeit und höhere Latenz machen es für Echtzeit- und Gesprächsanwendungen ungeeignet. Dafür empfehlen wir Eleven v2.5 Turbo/Flash.v3-Dokumentation und den FAQ.

Try it today

Melden Sie sich an bei ElevenLabs UI
Wählen Sie v3 (Alpha) im Modell-Dropdown
Fügen Sie Ihr Skript ein – nutzen Sie Tags oder Dialoge
Audio generieren

Wir sind gespannt, wie Sie v3 für neue Anwendungsfälle einsetzen – von immersivem Storytelling bis zu Produktionspipelines im Filmbereich.

Eleven v3 unterstützt eine Vielzahl von Audiotags, die je nach Stimme und Kontext variieren können. Weitere Informationen finden Sie im

Afrikaans (afr), Arabisch (ara), Armenisch (hye), Assamesisch (asm), Aserbaidschanisch (aze), Weißrussisch (bel), Bengalisch (ben), Bosnisch (bos), Bulgarisch (bul), Katalanisch (cat), Cebuano (ceb), Chichewa (nya), Kroatisch (hrv), Tschechisch (ces), Dänisch (dan), Niederländisch (nld), Englisch (eng), Estnisch (est), Filipino (fil), Finnisch (fin), Französisch (fra), Galicisch (glg), Georgisch (kat), Deutsch (deu), Griechisch (ell), Gujarati (guj), Hausa (hau), Hebräisch (heb), Hindi (hin), Ungarisch (hun), Isländisch (isl), Indonesisch (ind), Irisch (gle), Italienisch (ita), Japanisch (jpn), Javanisch (jav), Kannada (kan), Kasachisch (kaz), Kirgisisch (kir), Koreanisch (kor), Lettisch (lav), Lingala (lin), Litauisch (lit), Luxemburgisch (ltz), Mazedonisch (mkd), Malaiisch (msa), Malayalam (mal), Mandarin-Chinesisch (cmn), Marathi (mar), Nepali (nep), Norwegisch (nor), Paschtu (pus), Persisch (fas), Polnisch (pol), Portugiesisch (por), Punjabi (pan), Rumänisch (ron), Russisch (rus), Serbisch (srp), Sindhi (snd), Slowakisch (slk), Slowenisch (slv), Somali (som), Spanisch (spa), Swahili (swa), Schwedisch (swe), Tamil (tam), Telugu (tel), Thailändisch (tha), Türkisch (tur), Ukrainisch (ukr), Urdu (urd), Vietnamesisch (vie), Walisisch (cym)

Entdecken Sie Artikel des ElevenLabs-Teams

Resources

A layered, abstract composition of nested rounded squares radiating outward from a warm orange-red center, bleeding into vibrant pinks, purples, and blues at the edges, with a prismatic light flare on the left side giving it an iridescent, holographic feel.

Resources

Unpacking ElevenAgent's Orchestration Engine

A look under the hood at how ElevenAgents manages context, tools, and workflows to deliver real-time, enterprise-grade conversations.

Developer