ベータ版でリリースされたElevenLabs、30言語対応の基礎AI音声モデルEleven Multilingual v2を発表

公開日: 2023年8月22日

聴くこの記事を聴く

0:00

0:000:00

音声AIプラットフォームであるElevenLabsは、30言語に対応した新しい多言語ディープラーニングモデルであるEleven多言語v2を発表し、コンテンツの言語的な壁を取り除くための大きな一歩を踏み出します。
この進展により、世界中のメディア企業、ゲーム開発者、出版社、独立クリエイターはコンテンツのアクセス性を大幅に向上させることができます。
今年1月にプラットフォームが公開されて以来、多くの新機能のリリースと改善を経て、この新機能は会社の公式なベータ段階の終了を示します。
ElevenLabsの使命は、すべての言語と音声であらゆるコンテンツに誰もがアクセスできるようにすることです。

イギリスロンドン - 音声AIソフトウェア分野の世界的リーダーであるElevenLabsは今日、「感情豊かな」AIオーディオを正確に生成できる30言語の新しい多言語音声生成モデルを発表しました。

完全に独自の研究に基づくこの進展により、クリエイターはヨーロッパ、アジア、中東全域の国際市場をターゲットにしたローカライズされたオーディオコンテンツを制作できます。ElevenLabsは過去18か月間、人間の話し方の指標を分析し、話の生成で文脈を理解し感情を伝えるための新しいメカニズムを構築し、新しく独特な声を合成しました。

Eleven Multilingual v2を使用すると、テキストがElevenLabsのテキスト読み上げプラットフォームに入力されたとき、新しいモデルは約30の文字言語を自動的に識別し、これまでにないレベルの真実性でその言語で音声を生成できます。

同時に、合成音声またはクローン音声のいずれを使用しても、話者の独自の音声特性は元のアクセントを含めてすべての言語で維持されます。つまり、同じ音声を使用して30言語でコンテンツに命を吹き込むことができます。

この配信は、プラットフォーム上のすべてのクリエイターにプロフェッショナル

コピーを作成できます。今日のリリースは、ほぼ30言語で多言語モデルが提供する声を出せることを意味します。

対応言語には、韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、ベトナム語、フィリピン語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレー語、ハンガリー語、ノルウェー語、スロバキア語、クロアチア語、古典アラビア語、タミル語が含まれます。英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語を含む以前に利用可能な言語に加わりました。

最近の機能リリースとプラットフォームの継続的な改善に続き、ElevenLabsは今日、プラットフォームが正式にベータ版としてリリースされたことを確認しました。この移行は、100万人以上のグローバルユーザーに信頼できる最先端のツールを提供するための会社の献身において重要な瞬間を記念します。

今後、ElevenLabsは、ユーザーがプラットフォームで声を共有し、新しいオーディオ開発の利点を享受できるメカニズムを導入し、人間とAIの協力の機会を育む計画です。

ElevenLabsのCEO兼共同設立者であるMati Staniszewskiは次のように述べています。

「ElevenLabsはすべての言語と音声ですべてのコンテンツに誰もがアクセスできるようにする夢で始まりました。Eleven Multilingual v2 のリリースを通じて私たちはこの夢を現実化しすべての方言で人間品質の AI 音声を使用できるようにするための一歩をさらに進めました。デ 한 걸음 더 다가갔습니다。

「TTS（Text-to-Speech）生成ツールはゲームの場を均等化しすべてのクリエイターに最高品質の音声オーディオ機能を提供するのに役立ちます。これらの利点は今やほぼ 30言語で多言語アプリケーションとして拡張されます。私たちは AIの助けを借りてさらに多くの言語と声を扱いコンテンツに対する言語的障壁を取り除くことを願っています。ElevenLabsはこのようなアクセス性の飛躍が最終的により大きな創造性、革新および多様性を促進すると信じています。」および多様性を促進すると信じています。 "

複数の言語で高品質なオーディオコンテンツを作成するためのコストとリソースを削減することで、ElevenLabsは企業とクリエイターが文化や言語を超えて共感できる、より想像力豊かでアクセスしやすいコンテンツを制作できるよう支援します。

独立ゲーム開発者と出版社にとって、多言語音声生成ツールは国際的な観客のためにゲーム体験とオーディオコンテンツを翻訳する新しい機会を提供し、音声オーディオの品質や正確性を損なうことなく、自分の言語でプレイヤーやリスナーとつながります。

同様に、教育機関は、学習者に目標言語で正確なオーディオコンテンツを即座に提供し、言語理解と発音スキルを強化し、留学生のための多様な教育スタイルと学習ニーズを満たす手段を持つことができるようになりました。

すべてのタイプのクリエイターは、ElevenLabsのツールを使用して複数の言語で提供される音声で視覚的コンテンツを補完し、視覚障害がある人や追加の学習が必要な人々のコンテンツアクセス性を向上させることができます。

2023年1月に公開された初期のAI音声ツール群には、あらゆるテキストを音声に変換する機能や、自分の声のクローンを作成する機能が含まれていました。多言語音声合成ツールは、すべての言語と音声であらゆるコンテンツに誰もがアクセスできるようにするElevenLabsの使命に対するさらなる進歩です。

この技術はすでに、インディ作家がオーディオブックを作成できるようにし、ビデオゲームでサブキャラクターを音声で表示し、視覚障害者がオンラインの書面コンテンツにアクセスできるようにし、世界初のAIラジオチャンネルに電力を供給することを含め、さまざまな創造的な分野およびセクターで採用されています。ElevenLabsはまた、AIビデオジェネレーターD-ID、世界最大のオーディオブック出版社の一つであるStorytel、arXivに投稿された科学研究論文を要約するオープンアクセス科学ビデオプラットフォームScienceCast、先進的なグローバルコンテンツ制作プラットフォームTheSoul Publishing、 Embark StudiosおよびParadox Interactive、のような素晴らしいゲーム開発者、メディアプラットフォームMNTNを含む多様な先進的コンテンツ制作者およびスタジオとパートナーシップを結んでいます。

Scribe（スクライブ）が登場
カテゴリ
リサーチ
日付
2025年2月26日
Flashを紹介
カテゴリ
リサーチ
日付
2024年12月18日
新しい3言語の導入：ハンガリー語、ベトナム語、ノルウェー語
カテゴリ
リサーチ
日付
2024年7月30日
Eleven Turbo v2.5のご紹介
カテゴリ
リサーチ
日付
2024年7月19日

最高品質のAIオーディオで創造する

営業に相談サインアップ

関連記事

Scribe（スクライブ）が登場

Flashを紹介

新しい3言語の導入：ハンガリー語、ベトナム語、ノルウェー語

Eleven Turbo v2.5のご紹介