
Einführung von Eleven v3 (Alpha)
Das ausdrucksstärkste Text to Speech Modell
Entdecken Sie Voice Design v3: Erstellen Sie mühelos einzigartige KI-Stimmen. Beschreiben Sie Ihre gewünschte Stimme, erhalten Sie drei sofortige Optionen und setzen Sie sie für Kreative, Unternehmen und Entwickler ein.
Wir freuen uns, bekannt zu geben Voice Design v3. Die neue Version macht das Erstellen von Stimmen schneller, einfacher und intuitiver als je zuvor.
Voice Design v3 ist ideal für Kreative, Unternehmen und Entwickler, die spezifische Stimmen für ihr Projekt benötigen. Alles, was Sie tun müssen, ist Ihre Stimme zu beschreiben, sofort drei Optionen zu erhalten, Ihre Lieblingsstimme auszuwählen und sie sofort zu verwenden.
Probieren Sie es aus und sehen Sie, wie einfach die Stimmerstellung sein kann.
Als wir Voice Design einführten, war das Ziel einfach: jedem Kreativen die Möglichkeit zu geben, eine maßgeschneiderte Stimme zu erzeugen – ohne Studio-Buchung, ohne tiefes Eintauchen in Audiobibliotheken. Version 3 geht noch weiter und bietet mehr Kontrolle, schnellere Iterationen und einen reibungsloseren Weg vom Konzept zum finalen Audio.
Projekte erfordern oft Dutzende von Stimmen: ein ruhiger Erzähler, ein nervöser Nebencharakter, ein paar Spiel-NPCs, vielleicht sogar ein sprechender Waschbär. Die Suche nach „etwas Ähnlichem“ bremst Teams aus.
Voice Design v3 beseitigt diese Reibung. Geben Sie eine Beschreibung ein, generieren Sie drei Kandidaten, wählen Sie einen aus und machen Sie weiter – und zahlen Sie dabei nur für die Zeichen in Ihrem Prompt, nicht pro Sample.
Drücken Sie Generieren und v3 liefert drei unterschiedliche Stimmen. Behalten Sie die, die Ihnen gefällt – sie füllt einen Stimmenplatz – und verwerfen Sie den Rest. Keine Warteschlange. Keine zusätzlichen Kosten.
Keine Dropdown-Wälder. Keine versteckten Hebel. Nur Ergebnisse.
Nachfolgend finden Sie die Attribute, die unser Forschungsteam am häufigsten in hochwertigen Ergebnissen sieht:
Attribute | Why it matters | Example keywords |
---|---|---|
Age | Sets vocal texture and pitch | child, teen, middle-aged, elderly |
Accent/nationality | Grounds the character in place | thick Australian, light French, neutral American |
Gender | Guides resonance | male, female, gender-neutral |
Tone & emotion | Drives delivery | warm, assertive, anxious, joyful |
Speed | Controls pacing without editing | fast, measured, languid |
Guidance scale | Balances creativity vs. prompt fidelity | “guidance scale 10” (try 8–12 for accuracy, 3–5 for exploration) |
Für eine vollständige Matrix siehe den Prompting-Leitfaden in den Dokumenten.
Die besten Eingaben lesen sich wie Alltagssprache – kurz, spezifisch und ohne Fachjargon. Dieses Prinzip spiegelt unseren eigenen Schreibstil wider: Wenn ein Wort gestrichen werden kann, streichen Sie es.
Voice Design v3 ist im ElevenLabs-Dashboard verfügbar:Voices → My Voices → Add a new voice → Voice Design
Einloggen, geben Sie eine Eingabe ein und klicken Sie auf Generieren. Bald haben Sie drei neue Stimmen – von denen nur eine in Ihrem Kopf existierte.
Wir sehen uns im Studio.
Das ausdrucksstärkste Text to Speech Modell
Erstellen Sie dynamische Mehrcharakter-Dialoge mit Eleven v3 Audio Tags. Skripten Sie überlappende Stimmen, Unterbrechungen und emotionale Wechsel für natürliche, menschenähnliche KI-Gespräche.
Bereitgestellt von ElevenLabs Agenten