ElevenLabsがベータ版を終了し、30言語対応の基盤的なAI言語モデルEleven Multilingual v2を発表

  • ElevenLabs言語の壁を越えるために、30言語に対応した新しいディープラーニングモデルを発表し、言語AIプラットフォームとして大きな一歩を踏み出しました。Eleven Multilingual v2
  • この開発により、メディア企業、ゲーム開発者、出版社、独立した作家がコンテンツのアクセス性を大幅に向上させることができます。
  • この新しい機能は、プラットフォームが1月に開始されて以来の新機能と改善の一環であり、ベータフェーズの公式終了も示しています。
  • ElevenLabsは、すべてのコンテンツをあらゆる言語と声で普遍的にアクセス可能にすることを使命としています。

ロンドン、イギリスElevenLabs世界をリードする音声認識ソフトウェアプロバイダーが、新しい多言語音声生成モデルを発表しました。このモデルは、30言語で「感情豊かな」AIオーディオを生成することができます。

この開発は、完全に自社の研究に基づいており、デベロッパーがヨーロッパ、アジア、中東の国際市場向けにローカライズされたオーディオコンテンツを制作することを可能にします。ElevenLabsは過去18か月間、人間の言語の特徴を分析し、コンテキスト理解と感情表現の新しいメカニズムを開発し、独自の新しい声を合成しました。

Eleven Multilingual v2を使用すると、新しいモデルは、ElevenLabsのテキスト読み上げプラットフォームにテキストを入力する際に、ほぼ30の文字言語を自動的に認識し、これまでにないレベルの本物らしさで音声を生成することができます。

合成音声でもクローン音声でも、話者の独自の声の特徴はすべての言語で保持され、元のアクセントも含まれます。つまり、同じ声で30の異なる言語でコンテンツを生き生きとさせることができます。

この導入は、プラットフォーム上のすべてのクリエイター向けにプロフェッショナル ボイスクローンを公開した後に続きます。このプロダクトアップデートにより、追加のセーフティ機能とともに、ユーザーは自分の声の完璧なデジタルコピーを作成できるようになりました。

オリジナルとほとんど区別がつかないほどです。今日の発表により、あなたの声は多言語モデルで利用可能なほぼ30の言語で話すことができます。

対応言語には以下が含まれます:韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、ベトナム語、フィリピン語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレー語、ハンガリー語、ノルウェー語、スロバキア語、クロアチア語、標準アラビア語、タミル語。これらの言語は、既に利用可能な英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語を補完します。

新機能の導入とプラットフォームの継続的な改善に続き、ElevenLabsは今日、プラットフォームが正式にベータフェーズを終了したことを確認しました。この移行は、世界中の100万人以上のユーザーに信頼性の高い最先端のツールを提供するという企業のコミットメントにおける重要な瞬間を示しています。

将来的には、ElevenLabsはユーザーがプラットフォーム上で自分の声を共有し、新しいオーディオデータの開発から利益を得ることができるメカニズムを導入し、人間とAIの協力を促進することを計画しています。

ElevenLabsのCEO兼創設者であるMati Staniszewskiは次のように述べています:

「ElevenLabsは、すべてのコンテンツをあらゆる言語と声で普遍的にアクセス可能にするという夢を持って設立されました。Eleven Multilingual v2の発表により、この夢の実現に一歩近づき、あらゆる方言で人間の品質のAI音声を利用可能にしています。

私たちの音声合成ツールは、すべてのクリエイターに高品質な音声合成オプションを提供し、道を開いています。この利点は、ほぼ30の言語での多言語アプリケーションにも拡大しています。最終的には、AIの助けを借りてさらに多くの言語と声をカバーし、コンテンツの言語の壁を取り除くことを望んでいます。ElevenLabsでは、これらのアクセス性の飛躍が最終的により多くの創造性、革新、そして多様性につながると信じています。」

ElevenLabsは、高品質なオーディオコンテンツを複数の言語で作成するために必要なコストとリソースを削減します。企業やクリエイターは、文化的および言語的な境界を越えて共鳴する、より創造的でアクセスしやすいコンテンツを制作することができます。

独立したゲーム開発者や出版社にとって、多言語音声生成ツールは、国際的なオーディエンス向けにゲーム体験やオーディオコンテンツを翻訳し、プレイヤーやリスナーと彼らの言語でコミュニケーションを取る新しい機会を提供します。音声出力の品質や正確さを妥協することなく。

同様に、教育機関も、学習者に即座に正確なオーディオコンテンツを目標言語で提供し、言語理解と発音を向上させ、国際的な学生の多様な教育スタイルと学習ニーズに対応することができます。

あらゆる種類のクリエイターは、ElevenLabsのツールを利用して、アクセス性を視覚障害者や追加の学習ニーズを持つ人々のために向上させ、視覚的なコンテンツを複数の言語での音声で豊かにすることができます。

2023年1月に発表された最初のAI音声ツールスイートは、あらゆるテキストを音声に変換する機能を提供し、事前に定義された合成音声の選択肢と自分の声のクローンを作成する機能を備えています。多言語音声合成ツールは、ElevenLabsのすべてのコンテンツをあらゆる言語と声で普遍的にアクセス可能にするという使命のさらなる一歩です。

この技術は、すでにさまざまなクリエイティブな業界やセクターで使用されています。独立した作家がオーディオブックを執筆し、ビデオゲームのサブキャラクターに声を当て、視覚障害者がオンラインの書面コンテンツにアクセスしやすくし、世界初のAIラジオ局を運営することを可能にしています。ElevenLabsは、AIビデオジェネレーターD-IDStorytel、世界最大のオーディオブック出版社の一つであるオープンアクセスビデオプラットフォームScienceCast、科学研究を集約するビデオ生成ツールであるarXivに公開された、世界をリードするコンテンツ作成プラットフォームTheSoul Publishing、素晴らしいゲーム開発者であるEmbark StudiosParadox Interactive、メディアプラットフォームMNTNと提携しています。

ElevenLabsチームによる記事をもっと見る

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン