ElevenLabsがベータ版を終了し、Eleven Multilingual v2を発表 - 30言語対応のAI音声基盤モデル

公開日: 2023年8月22日

聴くこの記事を聴く

0:00

0:000:00

AI音声プラットフォームElevenLabs言語の壁をなくすための大きな一歩を踏み出しました。新しい基盤となるディープラーニングモデルを発表し、30言語にわたる多言語対応を実現しました - Eleven Multilingual v2
この進歩により、世界中のメディア企業、ゲーム開発者、出版社、独立したクリエイターがコンテンツのアクセス性を大幅に向上させることができます
これらの新機能は、1月のプラットフォーム開始以来の新機能と改善のリリースに続くもので、会社のベータ段階の正式な終了を示しています
ElevenLabsの使命は、すべてのコンテンツをあらゆる言語と声で世界中に提供することです

ロンドン、英国 - ElevenLabs、世界をリードするAI音声ソフトウェア企業が、本日、多言語対応の新しい音声生成モデルを発表しました。このモデルは、30言語で「感情豊か」なAI音声を生成する能力を持っています。

この進歩は、完全に社内研究に基づいており、クリエイターがヨーロッパ、アジア、中東の国際市場向けにローカルな音声コンテンツを制作することを可能にします。ElevenLabsは過去18か月間、人間の話し方の特徴を分析し、文脈理解と感情伝達の新しいメカニズムを構築し、独自の新しい声を集めてきました。

新しいEleven Multilingual v2モデルは、ElevenLabsのテキスト読み上げプラットフォームにテキストを入力することで、約30の書かれた言語を自動的に識別し、これまでにないレベルの本物らしさで音声を生成することができます。

同時に、使用される音声がAI音声であってもクローン音声であっても、話者の独自の音声特性はすべての言語で保持されます。これには、元のアクセントも含まれます。つまり、同じ音声を使用して、30の異なる言語でコンテンツを生き生きとさせることができます。

この発表に続きプラットフォーム上のすべてのクリエイター向けにプロフェッショナルボイスクローンの一般公開が行われました。このプロダクトの更新は、追加のセーフティ機能とともにリリースされ、ユーザーが自分の声の完璧なデジタルコピーを作成することを可能にします。仮想版

元の声と区別がつかない。今日のリリースにより、あなたの声はモデルが提供する約30の言語で話す能力を持つことになります。

対応言語には、韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、ベトナム語、フィリピン語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレー語、ハンガリー語、ノルウェー語、スロバキア語、クロアチア語、アラビア語、タミル語が含まれます。これらは、以前から利用可能だった英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語に加わります。

ElevenLabsは、最近の機能リリースとプラットフォームの継続的な改善を経て、本日、プラットフォームが正式にベータ版を終了することを確認しました。この移行は、100万人以上のグローバルユーザーに信頼性の高い先進的なツールを提供するという会社の献身の重要な瞬間を示しています。

ElevenLabsは、将来を見据え、ユーザーがプラットフォーム上で音声を共有し、新しい音声の開発を活用するメカニズムを提供することを計画しています。これにより、人間とAIの協力の機会が広がります。

ElevenLabsのCEO兼共同創設者であるマティ・スタニスズフスキは、次のようにコメントしています：

"ElevenLabsは、すべてのコンテンツをあらゆる言語と声で世界中に提供するという夢から始まりました。Eleven Multilingual v2のリリースにより、この夢を現実に近づけ、人間の品質を持つAI音声をすべてのアクセントで利用可能にする一歩を踏み出しました。

"私たちのテキスト読み上げツールは、すべてのクリエイターに高品質な音声能力を提供し、機会を均等にします。この利点は、約30の言語にわたる多言語アプリケーションにも拡大しています。最終的には、AIの助けを借りて、より多くの言語と声をカバーし、コンテンツの言語の壁を取り除くことを目指しています。ElevenLabsでは、これらのアクセス性の向上が、最終的により多くの創造性、革新性、多様性を促進すると信じています。

ElevenLabsは、複数の言語で高品質な音声コンテンツを作成するためのコストとリソースを削減することで、企業やクリエイターに対し、文化や言語を超えて共鳴する、より創造的でアクセスしやすいコンテンツを制作する機会を提供します。

多言語対応の音声生成ツールは、ゲーム開発者や独立した出版社に、新しいゲーム体験や音声コンテンツを国際的な観客に翻訳し、プレイヤーやリスナーと彼らの言語でつながる新しい機会を提供します。音声の品質や正確さを妥協することなく。

同様に、教育機関は今、学習者にターゲット言語で正確な音声コンテンツを即座に提供する手段を持ち、言語理解と発音のスキルを向上させ、さまざまな教育スタイルと国際学生の学習ニーズに応えます。

あらゆる種類のクリエイターは、ElevenLabsのツールを使用して、視覚障害者や追加の学習ニーズを持つ人々のために、視覚コンテンツを多言語での音声で補完することで、コンテンツのアクセス性を向上させることができます。

2023年1月に発表されたAI音声ツールの初期セットには、あらゆるテキストを事前に設計されたAI音声で読み上げる能力と、自分の声のコピーを作成する能力が含まれていました。多言語対応の音声合成ツールは、ElevenLabsの使命であるすべてのコンテンツをあらゆる言語と声で世界中に提供するためのさらなる一歩です。

多くのセクターやクリエイティブ分野はすでにこの技術を採用しており、独立した著者がオーディオブックを作成し、ビデオゲームのサブキャラクターに声を当て、視覚障害者がオンラインで書かれたコンテンツにアクセスできるようにし、世界初のAIラジオチャンネルを運営しています。ElevenLabsは、AIビデオジェネレーターD-ID、世界最大のオーディオブック出版社の一つであるStorytel、arXivに公開された科学論文を凝縮するビデオ生成ツールを持つオープンアクセスの科学ビデオプラットフォームScienceCast、世界をリードするコンテンツクリエイタープラットフォームTheSoul Publishing、Embark StudiosやParadox Interactiveのような素晴らしいゲーム開発者、MNTNメディアプラットフォームなど、さまざまなクリエイターやスタジオと提携しています。

笑うことができる初のAI
カテゴリ
リサーチ
日付
2022年11月24日
音声変換
カテゴリ
リサーチ
日付
2022年9月6日
Dubbing v2のご紹介
カテゴリ
リサーチ
日付
2026年5月28日
Music v2のご紹介
カテゴリ
リサーチ
日付
2026年5月26日

最高品質のAIオーディオで創造する

営業に相談サインアップ

関連記事

笑うことができる初のAI

音声変換

Dubbing v2のご紹介

Music v2のご紹介