Erkennung von ElevenLabs-Audio mit SynthID

Verfasst von: Daniel Fletcher
Veröffentlicht: 25. Juni 2026
Zuletzt aktualisiert: 22. Juli 2026

AnhörenArtikel anhören

0:00

0:000:00

Menschen sollten wissen, wenn sie mit KI interagieren. Früher war KI-generierter Inhalt leicht zu erkennen – er klang künstlich oder hatte sechs Finger. Mit den aktuellen Fortschritten der Modelle wird das jedoch immer schwieriger.

Da sich unsere Modelle für Stimme, Musik und Soundeffekte weiterentwickeln, möchten wir, dass Menschen erkennen können, ob Audio von KI erzeugt wurde – auch ohne Spezialwerkzeuge. Deshalb arbeiten wir mit Google DeepMind anSynthID: ein digitales Wasserzeichen, das direkt in von ElevenLabs erzeugte Audiodateien eingebettet wird. Diese Wasserzeichen sind für Menschen nicht hörbar und bleiben erhalten, auch wenn Clips gekürzt, beschleunigt, Metadaten entfernt oder in andere Dateiformate konvertiert werden. Ab dieser Woche fügen wir SynthID bei Text to Speech-Generierungen für kostenlose Nutzer hinzu und werden dies in den kommenden Wochen auf alle ElevenLabs-Audiogenerierungen ausweiten. Wichtig ist, dass diese Wasserzeichen mit unserem neuen kostenlosen

Mehr Transparenz und Verantwortlichkeit

Wir verbieten seit jeher die Nutzung unserer Tools zur Täuschung, Manipulation oder Belästigung. Unsere Systeme sind bereits darauf ausgelegt, Inhalte dem jeweiligen Nutzer zuzuordnen, damit wir angemessen reagieren können. Die Wasserzeichen mit SynthID stärken unser Engagement für Transparenz und Verantwortlichkeit, indem sie es der Öffentlichkeit ermöglichen, die Quelle eines Audioclips zu überprüfen.

In manchen Fällen möchten Menschen einfach wissen, ob ein Inhalt von KI erzeugt wurde. In anderen ist es wichtig zu erkennen, von welcher KI-Plattform er stammt. Deshalb starten wir heute unseren eigenen kostenlosenElevenLabs Audio-Detektor-Webseite, mit der überprüft werden kann, ob Audio von ElevenLabs erzeugt wurde. Das baut auf unserem bestehendenKI-Spracherkennerauf, nutzt aber SynthID, um die Zuordnung direkt und robuster im Audio zu verankern. Dieser Mechanismus ist wichtig, damit wir öffentlich für unsere Technologie einstehen und angemessen reagieren können, falls es jemandem gelingt, unsere umfassendenSchutzmaßnahmenzu umgehen und überzeugende Deepfakes zu erstellen.

Immer mehr Länder verlangen, dass KI-generierte Inhalte maschinenlesbar als synthetisch gekennzeichnet werden. Die Wasserzeichen mit SynthID ergänzen unser bestehendes Ökosystem für Herkunftsnachweise undCompliance-Tools, zu denen auch C2PA-Zertifikate gehören. Wir prüfen außerdem, SynthID in dieC2PA Soft Bindings Listaufzunehmen, damit Audio, dem die Inhaltsnachweise entfernt wurden, diese wieder zugeordnet werden können.

Hochwertige Wasserzeichen-Lösung

SynthID funktioniert, indem ein Klangmuster in Audioclips versteckt wird. Das Muster ist für das menschliche Ohr unhörbar, kann aber vom ElevenLabs Audio Detector erkannt werden. Jede Audiodatei erhält ein eigenes Muster, das auch nach gängigen Audiobearbeitungen wie Komprimierung, Kürzen oder Geschwindigkeitsänderungen erhalten bleibt.

SynthID hat in unseren Benchmarks überzeugt und alle technischen Anforderungen erfüllt:

Keine zusätzliche Time-to-First-Byte (TTFB)-Latenz
Hohe Erkennungsrate bei niedriger Falsch-Positiv-Rate
Robust gegenüber Kürzungen und anderen typischen Online-Transformationen
Für das menschliche Ohr nicht wahrnehmbar, ohne hörbare Qualitätsverluste
Kann nicht auf Audio kopiert werden, das nicht von ElevenLabs erzeugt wurde

Wir freuen uns auf die weitere Zusammenarbeit mit dem SynthID-Team von Google DeepMind, um die Audio-Wasserzeichen-Technologie weiterzuentwickeln.

Wie es weitergeht

Wasserzeichen dienen in erster Linie der Transparenz und Verantwortlichkeit, ermöglichen aber auch neue Produktfunktionen. Es gibt bereits einen etablierten Markt für digitale Herkunftsnachweise – Studios schützen damit ihr geistiges Eigentum, einzelne Kreative stellen sicher, dass sie bei Wiederverwendung ihrer Werke vergütet werden. In Zukunft könnten Wasserzeichen es Kreativen und Rechteinhabern ermöglichen, eigene Metadaten direkt in Inhalte einzubetten, um urheberrechtlich geschütztes Material auf Plattformen wie YouTube, Instagram und TikTok zu erkennen und darauf zu reagieren.

Wasserzeichen sind Teil unseres umfassenden Transparenzversprechens. Je leistungsfähiger und realistischer unsere Modelle werden, desto wichtiger ist eine starke Infrastruktur für Verantwortlichkeit. Je besser wir Inhalte ihrer Quelle zuordnen können, desto vertrauenswürdiger wird unser gemeinsames Informationsökosystem.

Erkennung von ElevenLabs-Audio mit SynthID

Mehr Transparenz und Verantwortlichkeit

Hochwertige Wasserzeichen-Lösung

Wie es weitergeht

Ähnliche Artikel

Text to Speech Barrierefreiheit: Warum die Stimmqualität zählt

ElevenMusic, ElevenCreative Music und ElevenAPI: Der Unterschied erklärt

KI-Kundenservice-Agenten: Was sie sind und wie Sie einen einsetzen

So erstellen Sie in weniger als einer Stunde einen KI-Agenten für Ihr Unternehmen