コンテンツにスキップ

ElevenLabsの音声:包括的ガイド

はじめに

ElevenLabsでは、生成音声AIの革新を推進しています。このガイドでは、プラットフォームの音声の背後にある実践、プロセス、技術の概要を提供します。

ElevenLabsの音声の分類

1. ElevenLabsの音声

プラットフォーム上のユーザーは、すぐに利用可能な既製の音声から選択できます。これらは、テキスト読み上げのドロップダウンメニューにデフォルトで表示される音声です。以下の2つのカテゴリに分かれます:


法的に契約された音声
これらは、プロのボイスアクターとの法的な有料パートナーシップを通じて取得した音声です。テキスト読み上げで見つかる音声の大部分を占めています。比類のない品質だけでなく、業界のアーティストを支援するという私たちのコミットメントの証として、これらを優先しています。

  • 特定のプロジェクトでプロのボイスアクターとのコラボレーション。
  • 固定契約で報酬を受けるボイスアクター。
  • ボイスアクターが自分の声の権利を保持するライセンス契約。

ランダムに生成された音声
これらは、音声特性をランダムにサンプリングする複雑なアルゴリズムを使用して生成された音声です。これらの音声は、ボイスデザインツールで生成されます。

  • ユニークで新しい - 生成される音声はすべて異なります。
  • 特定の個人の声を模倣または複製しません。
  • 特定の個人に属しません。

2. ユーザーの音声

VoiceLabは、ユーザーが音声を作成およびカスタマイズするためのツール群です。2つのボイスクローンモデル(インスタントボイスクローン(IVC)とプロフェッショナルボイスクローン(PVC))と、声の特性をランダムにサンプリングして新しい音声を生成するボイスデザインが含まれています。


インスタントボイスクローン(IVC)
インスタントボイスクローンは、短いサンプルに基づいてデジタルな声の類似を迅速に生成することを可能にします。IVCは、さまざまな声のスタイルを簡単に試せるように、プレビュー品質を低くして迅速な結果を提供するように設計されています。

主な特徴:

  • 短い音声サンプルからの迅速なクローン作成。

セキュリティ対策:

  • 膨大なデータが必要なゼロからのトレーニングとは異なり、この技術はゼロショットラーニングを使用します。AIは短い音声クリップを聞いて、追加のトレーニングなしで声を複製する方法を即座に把握します。結果は元のアップロードサンプルと完全には一致しません。
  • インスタントボイスクローンで個々のユーザーが追加した音声は、そのユーザーのアカウントにのみ限定され、共有できません。他のユーザーはIVCを使用して作成された音声にアクセスできません。

ユーザーの責任:

  • 各音声サンプルのアップロード前に、ユーザーは特定の声をクローンするための必要な権利と許可を取得していることを確認する必要があります。これはクローン作成プロセスを開始するための必須ステップです。
  • 音声クローン技術を安全に使用する方法についての詳細は、ボイスクローンガイドをご覧ください。
  • 特に許可なしに商業目的で音声クローン機能を不正使用すると、永久的な禁止を含む厳しい処罰が科されます。

プロフェッショナルボイスクローン(PVC)
プロフェッショナルボイスクローンは、より高度なボイスクローン機能であり、ユーザーが自分の声の高忠実度なレプリカを作成することを可能にします。これには、少なくとも30分のクリーンな音声データを使用して専用モデルをトレーニングすることが含まれます。

主な特徴:

  • 高忠実度で超リアルな音声再現。

セキュリティ対策:

  • PVCで生成される高忠実度の出力のため、ユーザーが自分の声のみをクローンできるようにするための強力なセキュリティ対策を実施しています。
  • トレーニング用の音声データをアップロードした後、ユーザーは検証ステップを通過する必要があります:10秒以内に音読するテキストキャプチャプロンプトが提供されます。
  • この録音からの声のプロファイルを、ユーザーがクローン用にアップロードしたデータに含まれる声と比較してリクエストを検証します。
  • 一致する場合、リクエストは微調整のために送信されます。一致しない場合、ユーザーは4回の検証試行が残っています。すべての試行が成功せずに終了した場合、ユーザーは手動の音声検証のためにヘルプセンターに連絡する必要があります。
  • デフォルトでは、個々のユーザーが追加した音声はそのユーザーのアカウントにのみ限定されます。
  • ユーザーは、プロフェッショナルボイスクローンをボイスライブラリを通じて他の人と共有し、報酬を得ることができます。

ユーザーの責任:

  • IVCと同様に、利用規約は個人の権利を尊重することの重要性を強調しています。この機能の不正使用は、迅速かつ厳格な対応を招き、プラットフォームからの永久的な禁止を含む可能性があります。

Voice Design
ボイスデザインは、年齢、性別、アクセントなどのユーザーが選択したパラメータに基づいて新しい合成音声を生成することを可能にします。この方法で作成された音声は、言語を超えて音声特性が一貫しています。

主な特徴:

  • ユニークで新しい - 生成される音声はすべて異なります。
  • 特定の個人の声を模倣または複製しません。
  • 特定の個人に属しません。

3. 共有された音声

ボイスライブラリは音声共有のための環境です。ユーザーは、ボイスデザインを使用して生成した音声や、プロフェッショナルボイスクローンで生成した自分の音声を共有できます。

コミュニティ音声共有と報酬
互換性:

  • Voice Design
  • プロフェッショナルボイスクローン

特徴:

  • 使用報酬:他のユーザーが共有された音声を利用すると報酬を得られます。
  • 音声発見:ライブラリからさまざまなコンテンツニーズに応じて音声を探索し使用できます。
  • ボイスライブラリのすべての音声には、無料の商業利用ライセンスが付与されています。

コンテンツ共有に関する注意
ElevenLabsは音声生成と音声クローンのための高度なツールを提供していますが、プラットフォームはオーディオファイルの公開や共有のメカニズムを提供していません。ボイスライブラリは、特定の音声を共有し、それを使用して新しいオーディオコンテンツを生成することを可能にしますが、実際のオーディオコンテンツ自体の共有は許可されていません。

ツールを使用して生成されたコンテンツの配布や共有は、ユーザーの裁量と責任に完全に委ねられています。

技術の責任ある使用を奨励し、利用規約に違反する行為が通知された場合には断固として対応します。利用規約。コミュニティが音声クローンの潜在的な影響を考慮し、法律およびプラットフォームのガイドラインに従って行動することを信頼しています。

透明性へのコミットメント

技術の責任ある使用を促進するためのツールとリソースを導入しました。

  • AIスピーチ分類器:ElevenLabsから生成された音声サンプルかどうかを誰でも確認できます。
  • Voice Captcha protection: Ensures the Professional Voice Cloning service remains secure.
  • 教育:法的専門家と共同で作成された、安全で合法的な音声クローン技術の使用に関するガイド。
  • 利用規約:技術の合法的な使用を強調するガイドライン。
  • プラットフォームで生成されたと疑われるコンテンツに懸念がある場合は、こちらから報告してください。

締めくくりの言葉

AI駆動の音声技術のパイオニアとして、透明性、誠実さ、尊重を重視しています。ボイスアクターコミュニティとの協力を大切にし、個人の権利を尊重しながらユーザーに価値を提供することを常に目指しています。今後も、人間の創造性を責任を持って拡張することにコミットしていきます。

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン