コンテンツにスキップ

Eleven v3(アルファ版)のご紹介

最も表現力豊かなテキスト読み上げモデル

v3

Eleven v3(アルファ版)を発表できることを嬉しく思います — 最も表現力豊かなテキスト読み上げモデル.

Eleven v3はアルファ版を終了し、一般公開されました。

  • 70以上の言語対応
  • 複数話者の対話
  • オーディオタグ(例:[excited]、[whispers]、[sighs] など)

70以上の言語対応は従来よりも多くのプロンプト設計が必要ですが、生成される音声は圧倒的です。

動画やオーディオブック、メディアツールなどを制作している方には、新たな表現力を体験できます。リアルタイムや会話型の用途には、現時点ではv2.5 TurboまたはFlashのご利用をおすすめします。v3のリアルタイム版も開発中です。

動画やオーディオブック、メディアツールを扱う場合、新たな表現力を体験できます。リアルタイムや会話型の用途には、現時点ではv2.5 TurboまたはFlashのご利用をおすすめします。v3のリアルタイム版も開発中です。API.

v3を開発した理由

v3を開発した理由表現力でした。より強調された感情や、会話の割り込み、自然なやりとりの再現が難しかったのです。

Multilingual v2のリリース以降、プロの映画制作やゲーム開発、教育、アクセシビリティ分野でAI音声が活用されてきました。しかし一番の課題は音質ではなく、

Eleven v3はこの課題を解決します。ため息やささやき、笑い、リアクションなど、まるで生きているような応答性のある音声を一から設計しました。

Feature What it unlocks
Audio tags Inline control of tone, emotion, and non-verbal reactions
Dialogue mode Multi-speaker conversations with natural pacing and interruptions
70+ languages Full coverage of high-demand global languages
Deeper text understanding Better stress, cadence, and expressivity from text input

Hear v3 for yourself

Background
Background

オーディオタグの使い方

オーディオタグの使い方ドキュメント内のv3プロンプトガイド.

オーディオタグはスクリプト内にインラインで記述し、小文字の角括弧で囲みます。詳しくは、

プロフェッショナルボイスクローン(PVC)は現時点ではEleven v3に最適化されていないため、従来モデルよりクローン品質が下がる場合があります。v3の機能を使いたい場合は、インスタントボイスクローン(IVC)やデザイン済みの音声をご利用ください。PVCの最適化は今後対応予定です。

1[happily][shouts] We did it! [laughs].

複数話者の対話を作成

複数話者の対話を作成するテキストtoダイアログAPIエンドポイントも追加しました。話者ごとにJSONオブジェクトの配列を用意すると、モデルが一体感のある重なり合う音声ファイルを生成します:

1[
2 {"speaker_id": "scarlett", "text": "(cheerfully) Perfect! And if that pop-up is bothering you, there’s a setting to turn it off under Notifications → Preferences."},
3 {"speaker_id": "lex", "text": "You are a hero. An actual digital wizard. I was two seconds from sending a very passive-aggressive support email."},
4 {"speaker_id": "scarlett", "text": "(laughs) Glad we could stop that in time. Anything else I can help with today?"}
5]
6

エンドポイントが自動で話者の切り替え、感情の変化、割り込みなどを管理します。

エンドポイントが自動で話者の切り替えや感情変化、割り込みを管理します。こちら.

v3 is our most expressive model

Background
Background

価格と提供状況

Plan Launch promo At the end of June
UI (self-serve) 80% off (~5× cheaper) Same as Multilingual V2
UI (enterprise) 80% off business plan pricing Business plan pricing

v3を有効にするには:

  • モデルピッカー」でEleven v3(アルファ版)

APIアクセスやStudioでの対応も近日中に開始予定です。先行利用をご希望の方は、営業までご連絡ください.

APIアクセスやStudioでの対応も近日中に開始予定です。先行利用をご希望の場合は、

v3を使わない方がよい場合

Eleven v3(アルファ版)は従来モデルよりもプロンプトエンジニアリングが必要です。うまく動作すれば素晴らしい出力が得られますが、安定性や遅延の面からリアルタイムや会話型の用途には適していません。これらにはEleven v2.5 Turbo/Flashをおすすめします。v3ドキュメントとFAQをご覧ください。

Try it today

Background
Background
  1. ログイン:ElevenLabs UI
  2. 「v3(アルファ版)」をモデル選択欄で選択
  3. スクリプトを貼り付け—タグや対話も利用可能
  4. 音声を生成

v3を使った新しい活用例や、没入感のあるストーリーテリングから映画制作パイプラインまで、皆さんのアイデアを楽しみにしています。

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン