コンテンツにスキップ

注目:MIT EmTech DigitalでのElevenLabs

公開日

聴くこの記事を聴く

先週ロンドンで開催されたMIT EmTech Digitalカンファレンスにて、ビジネス・政府・学術機関が連携し、先進的なAIプロダクトの機会を最大化し、課題に対応する方法についてのパネルディスカッションに参加しました。

ElevenLabsのほか、Alan Turing Institute、Ada Lovelace Institute、BTのリーダーが登壇し、MIT Technology ReviewのMelissa Heikkilä氏がモデレーターを務めました。

AIセーフティへの三本柱アプローチ

ElevenLabsでは、AIオーディオ技術の社会的影響を意識して開発しています。AIセーフティの責任者として、クリエイターや企業、ユーザーが安心して使える環境を整え、不正利用や悪意ある行為を防ぐことに注力しています。パネルでは、ElevenLabsをより安全で革新的な場にするための取り組みや、AIセーフティ課題への優先的な対応を促す戦略について紹介しました。主な戦略は以下の通りです:

出所証明(プロベナンス):AI生成コンテンツと実際のコンテンツを、その出所を理解することで区別します。上流のAI検出ツール(クラス分類器など)は、AI生成の出力を認識するために訓練された確率モデルです。ElevenLabsでは、誰でもサンプルをアップロードして当社プラットフォーム由来か確認できるAIスピーチクラス分類器を開発しました。また、Loccusと連携し、AIコンテンツの分類精度向上にも取り組んでいます。ただし、クラス分類器だけでは出所証明の万能策にはなりません。これを補うため、メタデータやウォーターマーク、フィンガープリントなどの下流AI検出手法も登場しています。業界全体の取り組みとして、暗号署名付きメタデータ標準C2PAのような、オープンかつ相互運用可能な規格を推奨しています。これにより、InstagramやFacebookなど主要な配信チャネルでAI生成コンテンツのラベリングが可能になります。

追跡性:AI生成コンテンツを特定のユーザーまで遡れるようにします。ElevenLabsでは、当社プラットフォームで生成されたコンテンツを元のアカウントに紐付けることができ、ボイスクローン機能は銀行情報で認証済みのユーザーのみ利用可能です。追跡性を重視することで、AIプラットフォーム利用者の行動に責任を持たせ、必要に応じて法的機関による特定も可能になります。

モデレーション:許容されるコンテンツや利用方法について明確なポリシーを定め、それに違反するコンテンツの生成を防ぐことです。ElevenLabsでは、自動システムで不適切なコンテンツを検出・フラグ付け・ブロックしています。フラグ付けされたコンテンツは人間のモデレーターが確認し、ポリシーが一貫して守られているかチェックします。公衆の信頼や安全を損なうコンテンツの生成を防ぐため、モデレーション技術も継続的に強化しています。OpenAIが提供するようなオープンソースのモデレーションエンドポイントを使えば、どんなAIアプリにも簡単にプロンプトモデレーションを組み込めます。

共通の目標に向けて協力

AIの安全な開発を最優先にしていますが、AIの悪用対策は一社だけでは解決できません。パネルでは、テック企業・政府・市民団体・一般の方々が広く連携し、社会や環境の変化に対応しながら安全なデジタル社会を実現する必要性を確認しました。ElevenLabsは、コミュニティ内でのオープンな対話を大切にし、Content Authenticity InitiativeElections Safety Accordなどの取り組みを通じて、誤情報対策にも力を入れています。

AIセーフティの将来への備え

パネルでは、AIプロダクトは安全に開発・利用されるべきだという点で全員が一致しました。同時に、創造的で予想外な使い方も認める必要があります。ElevenLabsのプラットフォームは、音声テキスト化を必要とする方のアクセシビリティ向上や、ALSなどの疾患で声を失った方に声を届ける用途でも活用されています。AI活用を広げるには、AIメディアへの理解を深め、デジタルコンテンツとの批判的な関わりを促し、真偽確認ツールの普及や、倫理的なAI利用について一般や各機関への教育が不可欠です。

関連記事

最高品質のAIオーディオで創造する