
StudyLabAI brings one-on-one tutoring to students globally with ElevenLabs Grant
Powering interactive, personalized learning experiences with voice AI
Eleven v3 アルファのご紹介
v3を試す自然な会話のためにトーン、感情、テンポをコントロール。テキスト読み上げにキャラクターの演技を追加。
Audio Tagsは、ElevenLabsの新しい研究プレビューであるEleven v3 (アルファ)のテキスト読み上げモデルにおける強力なツールです。これにより、トーンやペースだけでなく、キャラクターや声のパフォーマンスに対しても正確な指示が可能になります。
[海賊の声]、[フランス語アクセント]、[皮肉っぽく]といったタグを使うことで、声は単なるナレーションではなく、ストーリーテリングのツールになります。強力なキャラクターボイスクローンと組み合わせることで、音だけでなく、完全なパフォーマンスを捉えることができます。
これらのタグを使うことで、セリフの途中で声のアイデンティティを変えたり、アクセントを模倣したり、悪役やナレーター、サイドキックといったアーキタイプに寄せたりすることが可能です。スクリプトを変更したり、別の声に切り替えたりする必要はありません。
キャラクターパフォーマンスとは、役に入り込む能力です。派手な悪役や荒々しい船長、メルボルンの地元の店主を演じる際、新しいAudio Tagsを使えば、伝えたいキャラクターに合わせて表現を導くことができます。
シンプルな括弧付きのフレーズでシーンを設定できます: “[海賊の声] おお、広い海だ。嗅いでみろ、みんな。これが自由の香りだ…そして反乱の匂いも少し。”
このモデルは単に言葉を発音するだけでなく、キャラクターとして演じます。
声のパフォーマンスは音量や感情だけではありません。誰が話しているかも重要です。Eleven v3を使えば、特定のアクセントや方言、話し方を即座に指示できます。例えば:
[アメリカンアクセント] 古いモデルでアクセントを変えられた? [軽蔑的に] そうは思わなかったよ。[オーストラリアンアクセント] でも今はできるよ — 見てみて、友よ! [フランスアクセント] 私の愛は…赤い、赤いバラのようだ。
このような流動的なアイデンティティの切り替えは、アニメーション、ゲーム、インタラクティブフィクション、または話者の個性が重要な場面に最適です。
キャラクターに焦点を当てたタグは、声のアイデンティティと存在感を形作ります:
タグを重ねることでキャラクターに命を吹き込むことができます: “[ドラマチックに][フランスアクセント] あなたは理解していない…これは復讐のためではなかった。運命のためだったのだ。”
複数キャラクターのスクリプトでは、Audio Tagsを使うことで声を簡単に切り替えることができます。対話の途中でキャラクターパフォーマンスを切り替えるだけで、緊張感やユーモア、驚きを加えることができ、追加の編集は不要です。
デモからの抜粋を見てみましょう: "ジェシカ: [笑い] それは…美しかった。Dr. Von Fusion: [ドラマチックに] 生きるべきか死ぬべきか — それが問題だ!ジェシカ: [フランスアクセント] これは素晴らしいですね?"
以前はフルキャストが必要だったものが、今では単一のボイストラックでスクリプト化でき、レンジや深みを犠牲にすることはありません。
Eleven v3は、動的な声の変化、文脈のシフト、キャラクター間での一貫した表現をサポートします。これにより、モデルは単に何を言うかだけでなく、どのように各キャラクターが言うべきかを理解します。
クリエイターにとって、これは新しい次元のコントロールを解放します。単に対話をスクリプト化するだけでなく、パフォーマンスを指導することができます。
プロフェッショナル ボイスクローン (PVC) は現在、Eleven v3に完全には最適化されておらず、以前のモデルと比較してクローンの品質が低下する可能性があります。この研究プレビュー段階では、v3の機能を使用する必要がある場合、インスタント ボイスクローン (IVC) またはデザインされた声をプロジェクトに使用するのが最善です。PVCのv3への最適化は近い将来に予定されています。
Powering interactive, personalized learning experiences with voice AI
Create dynamic multi-character dialogue with Eleven v3 Audio Tags. Script overlapping voices, interruptions, and emotional shifts for natural, human-like AI conversations.
Powered by ElevenLabs 会話型AI