
ElevenLabsがベータ版を終了し、約30言語に対応した基盤AI音声モデルEleven Multilingual v2をリリース
この進展により、世界中のメディア企業、ゲーム開発者、出版社、独立系クリエイターがコンテンツのアクセシビリティを劇的に向上させることが可能になります。
- 音声AIプラットフォームElevenLabsは、コンテンツの言語の壁を取り除くために、新しい多言語対応の基盤となるディープラーニングモデルをリリースし、大きな進歩を遂げました。28言語対応 - その Eleven多言語対応 v2
- この進歩により、世界中のメディア企業、ゲームデベロッパー、出版社、独立したクリエイターが、コンテンツのアクセシビリティを劇的に向上させることができます。
- これらの新機能は、1月にプラットフォームが開始されて以来、多くの新機能のリリースと改善に続くものであり、同時に会社のベータフェーズの公式な終了を示します。
- ElevenLabsの使命は、すべてのコンテンツをあらゆる言語と声で普遍的にアクセス可能にすることです。
ElevenLabs、音声AIソフトウェアの世界的リーダーであるElevenLabsは、本日、新しい多言語音声生成モデルを発表しました。ほぼ30言語で「感情豊かな」AIオーディオを正確に生成することができます。
この進歩は、完全に社内の研究に基づいており、クリエイターがヨーロッパ、アジア、中東の国際市場向けにローカライズされたオーディオコンテンツを制作することを可能にします。ElevenLabsは過去18か月間、人間のスピーチの特徴を分析し、文脈を理解し、感情を伝える新しいメカニズムを構築し、新しいユニークな声を合成してきました。
Eleven Multilingual v2を使用すると、ElevenLabsのテキスト読み上げプラットフォームにテキストを入力すると、新しいモデルは、ほぼ30の書かれた言語を自動的に識別し、これまでにないレベルの本物らしさで音声を生成できます。
同時に、合成音声やクローン音声を使用しているかどうかに関わらず、話者の独自の声の特徴はすべての言語で維持され、元のアクセントも含まれます。これにより、同じ声を使用して28の異なる言語でコンテンツを生き生きとさせることができます。
この展開は、展開はの一般公開に続くものです。このプロダクトアップデートは、追加のセーフティとセキュリティ機能と共に提供され、ユーザーが自分の声を完璧にデジタルコピーできるようにします。オリジナルとほとんど区別がつかないものです。本日のリリースにより、あなたの声は多言語モデルが提供する約30の言語で話すことができるようになります。プロフェッショナル ボイスクローンの公開リリースに続くものです。このプロダクトアップデートは、追加のセーフティとセキュリティ機能と共に提供され、ユーザーが自分の声の完璧なデジタルコピーを作成できるようにします。今日のリリースにより、あなたの声は多言語モデルが提供するほぼ30の言語で話すことができるようになります。
対応言語には以下が含まれます; 中国語, 韓国語, オランダ語, トルコ語, スウェーデン語, インドネシア語, フィリピン語, 日本語, ウクライナ語, ギリシャ語, チェコ語, フィンランド語, ルーマニア語, デンマーク語, ブルガリア語, マレー語, スロバキア語, クロアチア語, 古典アラビア語とタミル語。
これらは以前から利用可能な言語に加わります、英語, ポーランド語, ドイツ語, スペイン語, フランス語, イタリア語, ヒンディー語とポルトガル語。
最近の機能リリースとプラットフォームの継続的な改善に続き、ElevenLabsは本日、プラットフォームが正式にベータを終了することを確認しました。この移行は、1百万以上のグローバルユーザーに信頼性の高い最先端のツールを提供するという会社の献身を示す重要な瞬間です。
今後、ElevenLabsは、ユーザーがプラットフォーム上で声を共有し、新しいオーディオの開発から利益を得ることができるメカニズムを導入し、人間とAIの協力の機会を促進する予定です。
ElevenLabsのCEO兼共同創設者であるMati Staniszewskiはコメントします:
ElevenLabsは、すべてのコンテンツをあらゆる言語と声で普遍的にアクセス可能にするという夢から始まりました。Eleven Multilingual v2のリリースにより、この夢を現実に近づけ、人間の品質の
「私たちのテキスト読み上げ生成ツールは、すべてのクリエイターに最高品質の音声オーディオ機能を提供し、競争の場を平等にします。これらの利点は、ほぼ30の言語にわたる多言語アプリケーションにまで拡大しています。最終的には、AIの助けを借りてさらに多くの言語と声をカバーし、コンテンツの言語の壁を取り除くことを望んでいます。ElevenLabsでは、これらのアクセシビリティの飛躍が最終的により大きな創造性、革新性、多様性を促進すると信じています。
複数の言語で高品質のオーディオコンテンツを作成するために必要なコストとリソースを削減することで、ElevenLabsは企業やクリエイターが文化や言語を超えて共鳴する、より創造的でアクセスしやすいコンテンツを制作できるようにしています。
独立したゲームデベロッパーや出版社にとって、多言語音声生成ツールは、ゲーム体験やオーディオコンテンツを国際的なオーディエンス向けに翻訳する新しい機会を提供し、プレイヤーやリスナーと彼らの言語でつながることができます。音声の品質や正確さを損なうことなく。 多言語音声生成ツールにより、ゲーム体験やオーディオコンテンツを国際的なユーザー向けに翻訳できる新しい可能性が広がります。話し言葉の品質や正確さを損なうことなく、プレイヤーやリスナーとそれぞれの言語でつながることができます。
同様に、教育機関は、学習者にターゲット言語で正確なオーディオコンテンツを即座に提供する手段を持ち、言語理解と発音スキルを強化し、国際的な学生のための異なる教育スタイルと学習ニーズに対応します。
あらゆるタイプのクリエイターは、ElevenLabsのツールを使用して、視覚コンテンツを複数の言語で利用可能な音声で補完することにより、視覚障害者や追加の学習ニーズを持つ人々のためのコンテンツのアクセシビリティを向上させることができます。
2023年1月に発表されたAI音声ツールの初期スイートには、あらゆるテキストを事前にデザインされた合成音声を使用して音声に変換する機能や、自分の声のクローンを作成する機能が含まれていました。多言語音声合成ツールは、ElevenLabsのすべてのコンテンツをあらゆる言語と声で普遍的にアクセス可能にするという使命のさらなる一歩です。
この技術は、インディー作家がオーディオブックを作成することを可能にし、ビデオゲームのサブキャラクターに声を当て、視覚障害者がオンラインの書かれたコンテンツにアクセスするのを支援し、世界初のAIラジオチャンネルを動かすなど、複数のクリエイティブな分野やセクターで既に受け入れられています。ElevenLabsはまた、AIビデオジェネレーターD-ID、世界最大のオーディオブック出版社の一つであるStorytel、オープンアクセスの科学ビデオプラットフォームScienceCast、そのビデオ生成ツールはarXivに掲載された科学研究論文を要約し、世界的なコンテンツクリエイタープラットフォームTheSoul Publishing、素晴らしいゲームデベロッパーであるEmbark StudiosとParadox Interactive、そしてメディアプラットフォームMNTNと提携しています。
お問い合わせ
press@elevenlabs.io
ElevenLabsチームによる記事をもっと見る


Introducing Experiments in ElevenAgents
The most data-driven way to improve real-world agent performance.
