SynthIDによるElevenLabs生成オーディオの検出
- 公開日
- 最終更新日
聴くこの記事を聴く
AIとやり取りしていることは、誰もが知るべきです。以前はAI生成コンテンツはロボットのような声や不自然な特徴ですぐに見分けられましたが、最近のモデルの進化で判別が難しくなっています。
私たちの音声・音楽・サウンドエフェクトのモデルが進化する中、専門的なツールがなくてもAI生成オーディオかどうかを判別できるようにしたいと考えています。そのため、Google DeepMindと提携し、SynthID:ElevenLabsが生成したオーディオに直接埋め込まれるデジタル透かしです。この透かしは人間の耳には聞こえず、クリップをトリミングしたり、再生速度を変更したり、メタデータを削除したり、別のファイル形式に変換した場合でも残ります。今週から、無料ユーザーによるテキスト読み上げの生成にSynthIDを含め始めており、今後数週間でElevenLabsのすべてのオーディオ生成に拡大していく予定です。なお、この透かしは新しく提供する無料の
透明性と説明責任の強化
私たちは以前から、当社ツールを使った人を欺く・操作する・嫌がらせをする行為を禁止しており、すでに生成コンテンツをユーザーまで追跡できる仕組みを備えています。SynthIDによるウォーターマークは、一般の方がオーディオクリップの出所を確認できるようにすることで、透明性と説明責任への取り組みをさらに強化します。
AI生成コンテンツかどうかを知りたい場合もあれば、どのAIプラットフォームで作られたかを知ることが重要な場合もあります。そこで本日、無料で使えるElevenLabsオーディオディテクターウェブページを公開しました。これにより、オーディオがElevenLabsで生成されたかどうかを確認できます。これは既存のAIスピーチ分類器をベースにしつつ、SynthIDを使ってより強固に出所情報をオーディオに直接埋め込んでいます。この仕組みにより、私たちの技術の力に対して社会的な説明責任を果たし、万が一悪意あるユーザーが包括的なセーフティをすり抜けて巧妙なディープフェイクを作成した場合にも、適切な対応が可能になります。
AI生成コンテンツに機械可読な形式で「合成」と明示することを求める国や地域が増えています。SynthIDによるウォーターマークは、既存の出所証明やコンプライアンスツール(C2PA認証など)を補完します。また、SynthIDをC2PAソフトバインディングリストに追加することで、コンテンツ認証情報が削除されたオーディオにも再付与できる可能性に期待しています。
高品質なウォーターマークソリューション
SynthIDは、オーディオクリップ内に音のパターンを隠すことで機能します。このパターンは人間の耳には聞こえませんが、ElevenLabs Audio Detectorで検出できます。各オーディオファイルごとに固有のパターンが付与され、圧縮やトリミング、速度変更など一般的な変換にも耐えます。
SynthIDは私たちのベンチマークで良好な結果を出し、すべての技術要件を満たしました:
- 最初のバイトまでの遅延(TTFB)に追加時間なし
- 高い検出率と低い誤検出率
- オンラインでよくあるトリミングや変換にも強い耐性
- 人間の耳には知覚できず、音質の劣化もなし
- ElevenLabsが生成していないオーディオにはコピー不可
今後もGoogle DeepMindのSynthIDチームと連携し、最先端のオーディオウォーターマーク技術を進化させていきます。
今後の展望
ウォーターマークは主に透明性と説明責任のためのものですが、新たなプロダクト機能も可能にします。すでにデジタルコンテンツ認証の市場は確立されており、スタジオは知的財産を守るため、個人クリエイターは作品の再利用時に報酬を得るために活用しています。将来的には、クリエイターやIP保有者が自分のメタデータを直接コンテンツに埋め込み、YouTubeやInstagram、TikTokなどのプラットフォームで再配布された著作物を検出・対応できるようになるかもしれません。
ウォーターマークは、私たちの透明性への幅広い取り組みの一部です。モデルがより高性能かつリアルになるほど、説明責任のための仕組みも進化が必要です。コンテンツの出所を明確にできるほど、私たちが共有する情報の信頼性も高まります。
%20(1).png&w=3840&q=80)



