
Eleven v3 Audio Tags: Emulating accents with precision
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Eleven v3 アルファのご紹介
v3を試すロンドン、英国 - ElevenLabs、世界をリードするAI音声ソフトウェア企業が、本日、多言語対応の新しい音声生成モデルを発表しました。このモデルは、30言語で「感情豊か」なAI音声を生成する能力を持っています。
この進歩は、完全に社内研究に基づいており、クリエイターがヨーロッパ、アジア、中東の国際市場向けにローカルな音声コンテンツを制作することを可能にします。ElevenLabsは過去18か月間、人間の話し方の特徴を分析し、文脈理解と感情伝達の新しいメカニズムを構築し、独自の新しい声を集めてきました。
新しいEleven Multilingual v2モデルは、ElevenLabsのテキスト読み上げプラットフォームにテキストを入力することで、約30の書かれた言語を自動的に識別し、これまでにないレベルの本物らしさで音声を生成することができます。
同時に、使用される音声がAI音声であってもクローン音声であっても、話者の独自の音声特性はすべての言語で保持されます。これには、元のアクセントも含まれます。つまり、同じ音声を使用して、30の異なる言語でコンテンツを生き生きとさせることができます。
この発表に続き プラットフォーム上のすべてのクリエイター向けにプロフェッショナル ボイスクローンの一般公開が行われました。このプロダクトの更新は、追加のセーフティ機能とともにリリースされ、ユーザーが自分の声の完璧なデジタルコピーを作成することを可能にします。仮想版
元の声と区別がつかない。今日のリリースにより、あなたの声はモデルが提供する約30の言語で話す能力を持つことになります。
対応言語には、韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、ベトナム語、フィリピン語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレー語、ハンガリー語、ノルウェー語、スロバキア語、クロアチア語、アラビア語、タミル語が含まれます。これらは、以前から利用可能だった英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語に加わります。
ElevenLabsは、最近の機能リリースとプラットフォームの継続的な改善を経て、本日、プラットフォームが正式にベータ版を終了することを確認しました。この移行は、100万人以上のグローバルユーザーに信頼性の高い先進的なツールを提供するという会社の献身の重要な瞬間を示しています。
ElevenLabsは、将来を見据え、ユーザーがプラットフォーム上で音声を共有し、新しい音声の開発を活用するメカニズムを提供することを計画しています。これにより、人間とAIの協力の機会が広がります。
ElevenLabsのCEO兼共同創設者であるマティ・スタニスズフスキは、次のようにコメントしています:
"ElevenLabsは、すべてのコンテンツをあらゆる言語と声で世界中に提供するという夢から始まりました。Eleven Multilingual v2のリリースにより、この夢を現実に近づけ、人間の品質を持つAI音声をすべてのアクセントで利用可能にする一歩を踏み出しました。
"私たちのテキスト読み上げツールは、すべてのクリエイターに高品質な音声能力を提供し、機会を均等にします。この利点は、約30の言語にわたる多言語アプリケーションにも拡大しています。最終的には、AIの助けを借りて、より多くの言語と声をカバーし、コンテンツの言語の壁を取り除くことを目指しています。ElevenLabsでは、これらのアクセス性の向上が、最終的により多くの創造性、革新性、多様性を促進すると信じています。
ElevenLabsは、複数の言語で高品質な音声コンテンツを作成するためのコストとリソースを削減することで、企業やクリエイターに対し、文化や言語を超えて共鳴する、より創造的でアクセスしやすいコンテンツを制作する機会を提供します。
多言語対応の音声生成ツールは、ゲーム開発者や独立した出版社に、新しいゲーム体験や音声コンテンツを国際的な観客に翻訳し、プレイヤーやリスナーと彼らの言語でつながる新しい機会を提供します。音声の品質や正確さを妥協することなく。
同様に、教育機関は今、学習者にターゲット言語で正確な音声コンテンツを即座に提供する手段を持ち、言語理解と発音のスキルを向上させ、さまざまな教育スタイルと国際学生の学習ニーズに応えます。
あらゆる種類のクリエイターは、ElevenLabsのツールを使用して、視覚障害者や追加の学習ニーズを持つ人々のために、視覚コンテンツを多言語での音声で補完することで、コンテンツのアクセス性を向上させることができます。
2023年1月に発表されたAI音声ツールの初期セットには、あらゆるテキストを事前に設計されたAI音声で読み上げる能力と、自分の声のコピーを作成する能力が含まれていました。多言語対応の音声合成ツールは、ElevenLabsの使命であるすべてのコンテンツをあらゆる言語と声で世界中に提供するためのさらなる一歩です。
多くのセクターやクリエイティブ分野はすでにこの技術を採用しており、独立した著者がオーディオブックを作成し、ビデオゲームのサブキャラクターに声を当て、視覚障害者がオンラインで書かれたコンテンツにアクセスできるようにし、世界初のAIラジオチャンネルを運営しています。ElevenLabsは、AIビデオジェネレーターD-ID、世界最大のオーディオブック出版社の一つであるStorytel、arXivに公開された科学論文を凝縮するビデオ生成ツールを持つオープンアクセスの科学ビデオプラットフォームScienceCast、世界をリードするコンテンツクリエイタープラットフォームTheSoul Publishing、Embark StudiosやParadox Interactiveのような素晴らしいゲーム開発者、MNTNメディアプラットフォームなど、さまざまなクリエイターやスタジオと提携しています。
Seamlessly switch accents mid-sentence with Eleven v3 Audio Tags. Emulate American, British, French, and more for dynamic, culturally rich AI speech.
Fine-grained control over timing, rhythm, and emphasis with Eleven v3 Audio Tags. Transform flat delivery into dynamic, performative content.