Direkt zum Inhalt

ElevenLabs Voices: Ein umfassender Leitfaden

Einführung

Bei ElevenLabs erweitern wir die Grenzen der Innovation in der generativen Sprach-KI. Dieser Leitfaden bietet einen Überblick über unsere Praktiken, Prozesse und die Technologie hinter den Stimmen unserer Plattform.

Kategorisierung der Stimmen bei ElevenLabs

1. ElevenLabs Stimmen

Nutzer unserer Plattform können aus einer Vielzahl von sofort verfügbaren, vorgefertigten Stimmen wählen. Diese sind standardmäßig im Dropdown-Menü der Sprachsynthese zu sehen und fallen in zwei Kategorien:


Rechtlich vertraglich gebundene Stimmen
Diese Stimmen werden durch rechtliche, bezahlte Partnerschaften mit professionellen Synchronsprechern erworben. Sie machen den Großteil der Stimmen in der Sprachsynthese aus. Wir priorisieren sie nicht nur wegen ihrer hohen Qualität, sondern auch als Beweis für unser Engagement zur Unterstützung von Künstlern in der Branche.

  • Zusammenarbeit mit professionellen Synchronsprechern bei spezifischen Projekten.
  • Synchronsprecher werden auf befristeten Verträgen vergütet.
  • Lizenzvereinbarungen stellen sicher, dass Synchronsprecher die Rechte an ihren Stimmen behalten.

Zufällig generierte Stimmen
Diese Stimmen werden mit komplexen Algorithmen erzeugt, die zufällig Stimmmerkmale sampeln. Diese Stimmen werden mit unserem Voice Design Tool generiert.

  • Einzigartig und neuartig - jede generierte Stimme ist anders.
  • Imitieren oder replizieren keine spezifische individuelle Stimme.
  • Gehören keiner spezifischen Person.

2. Nutzerstimmen

VoiceLab ist unser Toolset für Nutzer zur Erstellung und Anpassung von Stimmen. Es umfasst zwei Stimmklonmodelle (Instant Voice Cloning (IVC) und Professional Voice Cloning (PVC)) und Voice Design - ein Tool zur Generierung neuer Stimmen durch zufälliges Sampeln von Stimmmerkmalen.


Instant Voice Cloning (IVC)
Instant Voice Cloning ermöglicht es Nutzern, schnell ein digitales Abbild einer Stimme basierend auf kurzen Samples zu erstellen. IVC ist darauf ausgelegt, schnelle Ergebnisse mit niedrigerer Vorschauqualität zu bieten, was das Experimentieren mit verschiedenen Stimmstilen erleichtert.

Hauptmerkmale:

  • Schnelles Klonen aus kurzen Stimmproben.

Sicherheitsmaßnahmen:

  • Im Gegensatz zum Training von Grund auf, bei dem große Datenmengen benötigt werden, verwendet diese Technik das sogenannte Zero-Shot-Learning. Hierbei hört die KI einen kurzen Audioclip und erfasst sofort, wie eine Stimme repliziert werden kann, ohne dass weiteres Training erforderlich ist. Die Ergebnisse ähneln nicht identisch den ursprünglichen Upload-Samples.
  • Von einem Nutzer für Instant Voice Cloning hinzugefügte Stimmen bleiben exklusiv für das Konto dieses Nutzers und können nicht geteilt werden. Kein anderer Nutzer hat Zugriff auf mit IVC erstellte Stimmen.

Verantwortlichkeiten der Nutzer:

  • Vor jedem Upload von Stimmproben müssen Nutzer bestätigen, dass sie die notwendigen Rechte und Genehmigungen zur Klonung der spezifischen Stimme erhalten haben. Dies ist ein obligatorischer Schritt, um den Klonprozess zu starten.
  • Für weitere Informationen zur sicheren Nutzung unserer Stimmklontechnologie, siehe unser Voice Cloning Guide.
  • Missbrauch der Stimmklonfunktion, insbesondere für unautorisierte oder kommerzielle Zwecke ohne ordnungsgemäße Zustimmung, führt zu strengen Konsequenzen, einschließlich permanenter Sperren.

Professional Voice Cloning (PVC)
Professional Voice Cloning ist eine fortschrittlichere Stimmklonfunktion, die es Nutzern ermöglicht, eine hochauflösende Replik ihrer eigenen Stimme zu erstellen. Dies erfordert das Training eines dedizierten Modells mit einem großen Satz von Stimmproben – mindestens 30 Minuten saubere Audiodaten.

Hauptmerkmale:

  • Hochauflösende, ultra-realistische Stimmwiedergabe.

Sicherheitsmaßnahmen:

  • Aufgrund der hohen Wiedergabetreue der mit PVC erzeugten Ausgaben haben wir robuste Sicherheitsmaßnahmen implementiert, um sicherzustellen, dass Nutzer nur ihre eigene Stimme klonen können.
  • Nach dem Hochladen von Sprachdaten zum Training muss ein Nutzer einen Verifizierungsschritt bestehen: Ein Text-Captcha wird bereitgestellt, das der Nutzer innerhalb von 10 Sekunden laut vorlesen muss.
  • Wir validieren die Anfrage, indem wir das Stimmprofil dieser Aufnahme mit der Stimme vergleichen, die der Nutzer zum Klonen hochgeladen hat.
  • Wenn es eine Übereinstimmung gibt, wird die Anfrage zur Feinabstimmung gesendet. Wenn nicht, hat der Nutzer noch 4 Verifizierungsversuche. Nach Ausschöpfung aller Versuche ohne Erfolg muss der Nutzer über unser Help Center eine manuelle Stimmverifizierung anfordern.
  • Standardmäßig bleiben von einem Nutzer hinzugefügte Stimmen exklusiv für das Konto dieses Nutzers.
  • Nutzer können wählen, ihre Professional Voice Clone über die Voice Library zu teilen, damit andere sie nutzen können, und Belohnungen erhalten, wenn sie dies tun.

Verantwortlichkeiten der Nutzer:

  • Ähnlich wie bei IVC betonen unsere Nutzungsbedingungen die Wichtigkeit der Achtung individueller Rechte. Missbrauch dieser Funktion, der gegen unsere Bedingungen verstößt, führt zu schnellen und entschiedenen Maßnahmen, bis hin zu permanenten Sperren von unserer Plattform.

Voice Design
Voice Design ermöglicht die Generierung neuer synthetischer Stimmen basierend auf vom Nutzer gewählten Parametern wie Alter, Geschlecht und Akzent. Auf diese Weise erstellte Stimmen bleiben in ihren Sprachmerkmalen über Sprachen hinweg konsistent.

Hauptmerkmale:

  • Einzigartig und neuartig - jede generierte Stimme ist anders.
  • Imitieren oder replizieren keine spezifische individuelle Stimme.
  • Gehören keiner spezifischen Person.

3. Geteilte Stimmen

Voice Library ist unsere Umgebung für das Teilen von Stimmen. Nutzer können entweder mit Voice Design generierte Stimmen oder ihre eigene Stimme, die mit Professional Voice Cloning erstellt wurde, teilen.

Community-Stimmen teilen & Belohnungen
Kompatibilität:

  • Voice Design
  • Professional Voice Cloning

Funktionen:

  • Nutzungsbelohnungen: Nutzer erhalten Belohnungen, wenn andere ihre geteilte Stimme nutzen.
  • Stimmenentdeckung: Entdecken und nutzen Sie Stimmen aus der Bibliothek für verschiedene Inhaltsbedürfnisse.
  • Alle Stimmen in der Voice Library kommen mit einer kostenlosen kommerziellen Nutzungslizenz.

Ein Hinweis zum Teilen von Inhalten
Obwohl ElevenLabs fortschrittliche Tools zur Stimmerzeugung und Stimmklonung bietet, ist es wichtig zu beachten, dass unsere Plattform keinen Mechanismus zum Veröffentlichen oder Teilen von Audiodateien bietet. Voice Library ermöglicht es Nutzern, bestimmte Stimmen zu teilen, die wiederum zur Erstellung neuer Audioinhalte verwendet werden können, aber es erlaubt nicht das Teilen von tatsächlichen Audioinhalten selbst.

Jegliche Verbreitung oder das Teilen von mit unseren Tools erstellten Inhalten außerhalb unserer Plattform liegt vollständig im Ermessen und in der Verantwortung des Nutzers.

Wir ermutigen zur verantwortungsvollen und respektvollen Nutzung unserer Technologie und werden entschlossen handeln, wenn wir über Verstöße gegen unsere Nutzungsbedingungen informiert werden. Wir vertrauen darauf, dass unsere Community sich der potenziellen Auswirkungen der Stimmklonung bewusst ist und im Einklang mit dem Gesetz und den Richtlinien unserer Plattform handelt.

Unser Engagement für Transparenz

Wir haben Tools und Ressourcen eingeführt, um die verantwortungsvolle Nutzung unserer Technologie zu erleichtern.

  • KI-Spracherkenner: Ermöglicht jedem zu überprüfen, ob ein Audiobeispiel von ElevenLabs stammt.
  • Voice Captcha protection: Ensures the Professional Voice Cloning service remains secure.
  • Bildung: Kollaborative Leitfäden zur sicheren und legalen Nutzung der Stimmklontechnologie, erstellt mit Rechtsexperten.
  • Nutzungsbedingungen: Richtlinien, die die rechtmäßige Nutzung unserer Technologie betonen.
  • Wenn Sie auf Inhalte stoßen, die Ihrer Meinung nach auf unserer Plattform generiert wurden und Bedenken hervorrufen, melden Sie diese bitte hier.

Abschließende Bemerkung

Als Pioniere in KI-gesteuerten Sprachtechnologien legen wir Wert auf Transparenz, Integrität und Respekt. Wir schätzen unsere Zusammenarbeit mit der Synchronsprecher-Community und streben stets danach, unseren Nutzern Mehrwert zu bieten, während wir individuelle Rechte respektieren. Auf unserem weiteren Weg bleiben wir verpflichtet, menschliche Kreativität verantwortungsvoll zu fördern.

ElevenLabs

AI-Audioinhalte in höchster Qualität generieren

Kostenlos registrieren

Haben Sie bereits ein Konto? Anmelden