Erkennung von ElevenLabs-Audio mit SynthID
- Verfasst von
- Daniel Fletcher
- Veröffentlicht
- Zuletzt aktualisiert
AnhörenArtikel anhören
Menschen sollten wissen, wenn sie mit KI interagieren. Früher war KI-generierter Inhalt leicht zu erkennen – er klang künstlich oder hatte sechs Finger. Mit den aktuellen Fortschritten der Modelle wird das jedoch immer schwieriger.
Da sich unsere Modelle für Stimme, Musik und Soundeffekte weiterentwickeln, möchten wir, dass Menschen erkennen können, ob Audio von KI erzeugt wurde – auch ohne Spezialwerkzeuge. Deshalb arbeiten wir mit Google DeepMind anSynthID: ein digitales Wasserzeichen, das direkt in von ElevenLabs erzeugte Audiodateien eingebettet wird. Diese Wasserzeichen sind für Menschen nicht hörbar und bleiben erhalten, auch wenn Clips gekürzt, beschleunigt, Metadaten entfernt oder in andere Dateiformate konvertiert werden. Ab dieser Woche fügen wir SynthID bei Text to Speech-Generierungen für kostenlose Nutzer hinzu und werden dies in den kommenden Wochen auf alle ElevenLabs-Audiogenerierungen ausweiten. Wichtig ist, dass diese Wasserzeichen mit unserem neuen kostenlosen
Mehr Transparenz und Verantwortlichkeit
Wir verbieten seit jeher die Nutzung unserer Tools zur Täuschung, Manipulation oder Belästigung. Unsere Systeme sind bereits darauf ausgelegt, Inhalte dem jeweiligen Nutzer zuzuordnen, damit wir angemessen reagieren können. Die Wasserzeichen mit SynthID stärken unser Engagement für Transparenz und Verantwortlichkeit, indem sie es der Öffentlichkeit ermöglichen, die Quelle eines Audioclips zu überprüfen.
In manchen Fällen möchten Menschen einfach wissen, ob ein Inhalt von KI erzeugt wurde. In anderen ist es wichtig zu erkennen, von welcher KI-Plattform er stammt. Deshalb starten wir heute unseren eigenen kostenlosenElevenLabs Audio-Detektor-Webseite, mit der überprüft werden kann, ob Audio von ElevenLabs erzeugt wurde. Das baut auf unserem bestehendenKI-Spracherkennerauf, nutzt aber SynthID, um die Zuordnung direkt und robuster im Audio zu verankern. Dieser Mechanismus ist wichtig, damit wir öffentlich für unsere Technologie einstehen und angemessen reagieren können, falls es jemandem gelingt, unsere umfassendenSchutzmaßnahmenzu umgehen und überzeugende Deepfakes zu erstellen.
Immer mehr Länder verlangen, dass KI-generierte Inhalte maschinenlesbar als synthetisch gekennzeichnet werden. Die Wasserzeichen mit SynthID ergänzen unser bestehendes Ökosystem für Herkunftsnachweise undCompliance-Tools, zu denen auch C2PA-Zertifikate gehören. Wir prüfen außerdem, SynthID in dieC2PA Soft Bindings Listaufzunehmen, damit Audio, dem die Inhaltsnachweise entfernt wurden, diese wieder zugeordnet werden können.
Hochwertige Wasserzeichen-Lösung
SynthID funktioniert, indem ein Klangmuster in Audioclips versteckt wird. Das Muster ist für das menschliche Ohr unhörbar, kann aber vom ElevenLabs Audio Detector erkannt werden. Jede Audiodatei erhält ein eigenes Muster, das auch nach gängigen Audiobearbeitungen wie Komprimierung, Kürzen oder Geschwindigkeitsänderungen erhalten bleibt.
SynthID hat in unseren Benchmarks überzeugt und alle technischen Anforderungen erfüllt:
- Keine zusätzliche Time-to-First-Byte (TTFB)-Latenz
- Hohe Erkennungsrate bei niedriger Falsch-Positiv-Rate
- Robust gegenüber Kürzungen und anderen typischen Online-Transformationen
- Für das menschliche Ohr nicht wahrnehmbar, ohne hörbare Qualitätsverluste
- Kann nicht auf Audio kopiert werden, das nicht von ElevenLabs erzeugt wurde
Wir freuen uns auf die weitere Zusammenarbeit mit dem SynthID-Team von Google DeepMind, um die Audio-Wasserzeichen-Technologie weiterzuentwickeln.
Wie es weitergeht
Wasserzeichen dienen in erster Linie der Transparenz und Verantwortlichkeit, ermöglichen aber auch neue Produktfunktionen. Es gibt bereits einen etablierten Markt für digitale Herkunftsnachweise – Studios schützen damit ihr geistiges Eigentum, einzelne Kreative stellen sicher, dass sie bei Wiederverwendung ihrer Werke vergütet werden. In Zukunft könnten Wasserzeichen es Kreativen und Rechteinhabern ermöglichen, eigene Metadaten direkt in Inhalte einzubetten, um urheberrechtlich geschütztes Material auf Plattformen wie YouTube, Instagram und TikTok zu erkennen und darauf zu reagieren.
Wasserzeichen sind Teil unseres umfassenden Transparenzversprechens. Je leistungsfähiger und realistischer unsere Modelle werden, desto wichtiger ist eine starke Infrastruktur für Verantwortlichkeit. Je besser wir Inhalte ihrer Quelle zuordnen können, desto vertrauenswürdiger wird unser gemeinsames Informationsökosystem.
%20(1).png&w=3840&q=80)



