Eleven v3 アルファのご紹介

v3を試す

ベータ版でリリースされたElevenLabs、30言語対応の基礎AI音声モデルEleven Multilingual v2を発表

  • 音声AIプラットフォームであるElevenLabsは、30言語に対応した新しい多言語ディープラーニングモデルであるEleven Multilingual v2を発表し、コンテンツの言語的な壁を取り除くための大きな一歩を踏み出します。
  • この進展により、世界中のメディア企業、ゲーム開発者、出版社、独立クリエイターはコンテンツのアクセス性を大幅に向上させることができます。
  • 今年1月にプラットフォームが公開されて以来、多くの新機能のリリースと改善を経て、この新機能は会社の公式なベータ段階の終了を示します。
  • ElevenLabsの使命は、すべての言語と音声であらゆるコンテンツに誰もがアクセスできるようにすることです。

イギリス ロンドン - 音声AIソフトウェア分野の世界的リーダーであるElevenLabsは今日、「感情豊かな」AIオーディオを正確に生成できる30言語の新しい多言語音声生成モデルを発表しました。

完全に独自の研究に基づくこの進展により、クリエイターはヨーロッパ、アジア、中東全域の国際市場をターゲットにしたローカライズされたオーディオコンテンツを制作できます。ElevenLabsは過去18か月間、人間の話し方の指標を分析し、話の生成で文脈を理解し感情を伝えるための新しいメカニズムを構築し、新しく独特な声を合成しました。

Eleven Multilingual v2を使用すると、テキストがElevenLabsのテキスト読み上げプラットフォームに入力されたとき、新しいモデルは約30の文字言語を自動的に識別し、これまでにないレベルの真実性でその言語で音声を生成できます。

同時に、合成音声またはクローン音声のいずれを使用しても、話者の独自の音声特性は元のアクセントを含めてすべての言語で維持されます。つまり、同じ音声を使用して30言語でコンテンツに命を吹き込むことができます。

この配信は、プラットフォームのすべてのクリエイターにProfessional Voice Cloningの公開に続いて行われます。追加の安全およびセキュリティ機能とともにリリースされたこの製品アップデートにより、ユーザーはオリジナルとほとんど区別がつかない完璧な自分の音声デジタル

コピーを作成できます。今日のリリースは、ほぼ30言語で多言語モデルが提供する声を出せることを意味します。

対応言語には、韓国語、オランダ語、トルコ語、スウェーデン語、インドネシア語、ベトナム語、フィリピン語、ウクライナ語、ギリシャ語、チェコ語、フィンランド語、ルーマニア語、デンマーク語、ブルガリア語、マレー語、ハンガリー語、ノルウェー語、スロバキア語、クロアチア語、古典アラビア語、タミル語が含まれます。英語、ポーランド語、ドイツ語、スペイン語、フランス語、イタリア語、ヒンディー語、ポルトガル語を含む以前に利用可能な言語に加わりました。

最近の機能リリースとプラットフォームの継続的な改善に続き、ElevenLabsは今日、プラットフォームが正式にベータ版としてリリースされたことを確認しました。この移行は、100万人以上のグローバルユーザーに信頼できる最先端のツールを提供するための会社の献身において重要な瞬間を記念します。

今後、ElevenLabsは、ユーザーがプラットフォームで声を共有し、新しいオーディオ開発の利点を享受できるメカニズムを導入し、人間とAIの協力の機会を育む計画です。

ElevenLabsのCEO兼共同設立者であるMati Staniszewskiは次のように述べています。

「ElevenLabs すべての 言語と 音声で すべての コンテンツに 誰もが アクセスできる ようにする 夢で 始まりました。Eleven Multilingual v2 のリリースを 通じて 私たちは この 夢を 現実化し すべての 方言で 人間 品質の AI 音声を 使用できる ようにする ための 一歩を さらに 進めました 걸음 다가갔습니다.

「TTS(Text-to-Speech)生成 ツールは ゲームの 場を 均等化し すべての クリエイターに 最高 品質の 音声 オーディオ 機能を 提供する のに 役立ちますこれらの 利点は 今や ほぼ 30言語で 多言語 アプリケーションとして 拡張されます私たちは AI 助けを借りて さらに 多くの 言語と 声を 扱い コンテンツに 対する 言語的 障壁を 取り除くことを 願っています。ElevenLabs このような アクセス性の 飛躍が 最終的に より 大きな 創造性革新 および 多様性を 促進する と信じています。」 다양성을 촉진할 것이라고 믿습니다.”

複数の言語で高品質なオーディオコンテンツを作成するためのコストとリソースを削減することで、ElevenLabsは企業とクリエイターが文化や言語を超えて共感できる、より想像力豊かでアクセスしやすいコンテンツを制作できるよう支援します。

独立ゲーム開発者と出版社にとって、多言語音声生成ツールは国際的な観客のためにゲーム体験とオーディオコンテンツを翻訳する新しい機会を提供し、音声オーディオの品質や正確性を損なうことなく、自分の言語でプレイヤーやリスナーとつながります。

同様に、教育機関は、学習者に目標言語で正確なオーディオコンテンツを即座に提供し、言語理解と発音スキルを強化し、留学生のための多様な教育スタイルと学習ニーズを満たす手段を持つことができるようになりました。

すべてのタイプのクリエイターは、ElevenLabsのツールを使用して複数の言語で提供される音声で視覚的コンテンツを補完し、視覚障害がある人や追加の学習が必要な人々のコンテンツアクセス性を向上させることができます。

2023年1月に公開された初期のAI音声ツール群には、あらゆるテキストを音声に変換する機能や、自分の声のクローンを作成する機能が含まれていました。多言語音声合成ツールは、すべての言語と音声であらゆるコンテンツに誰もがアクセスできるようにするElevenLabsの使命に対するさらなる進歩です。

この技術はすでに、インディ作家がオーディオブックを作成できるようにし、ビデオゲームでサブキャラクターを音声で表示し、視覚障害者がオンラインの書面コンテンツにアクセスできるようにし、世界初のAIラジオチャンネルに電力を供給することを含め、さまざまな創造的な分野およびセクターで採用されています。ElevenLabsはまた、AIビデオジェネレーターD-ID、世界最大のオーディオブック出版社の一つであるStorytel、arXivに投稿された科学研究論文を要約するオープンアクセス科学ビデオプラットフォームScienceCast、先進的なグローバルコンテンツ制作プラットフォームTheSoul Publishing、 Embark StudiosおよびParadox Interactive、のような素晴らしいゲーム開発者、メディアプラットフォームMNTNを含む多様な先進的コンテンツ制作者およびスタジオとパートナーシップを結んでいます。

もっと見る

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン