会話が物語を動かします。 Eleven v3オーディオタグ を使えば、重なり合う声やテンポの速いやり取り、感情的なやりとりを一つのモデルで表現できます。
[interrupting]、[overlapping]、[laughs]のようなタグを組み合わせることで、中断やトーンの変化、自然な反応を含む人間の会話のような自然な対話を作成できます。
これは単なる行ごとのスピーチではありません。マルチキャラクターのパフォーマンスです。
AIスピーチにおけるマルチキャラクター対話とは?
再生
再生 マルチキャラクターの対話とは、一つの音声モデル が同じシーンで複数の異なる役を演じることです。各キャラクターは異なるスタイル、トーン、リズムで話し、時には中断したり同時に話したりします。
Eleven v3 を使えば、これを直接スクリプト化できます: マリッサ: [話し始める] だから、こう考えてたんだけど— クリス: [中断して] —新しいタイミング機能をテストする? マリッサ: [驚いて] その通り!どうやって— クリス: [重なって] —考えてることがわかったの?運が良かっただけ! マリッサ: [笑う] 正直言って?これ、ちょっと楽しいね。
結果は縫い合わされたナレーションではなく、本物の対話のように感じられます。
ボイスアクティングからインタラクションへ 以前は複数のスピーカーや録音、タイミング調整が必要だったものが、今では1つのスクリプトで対応可能。タグを使って1つのシーン内で各声を独立して指示できます。
例:ジェシカ:[ささやく] こんな感じ。ヴォン・フュージョン:[皮肉っぽく] おお、見てごらん、ミス・ファンシーパンツ。ジェシカ:[フランス語のアクセントで] これは素晴らしいですね。
声はただ交互に出るだけでなく、相互作用し、反応し、重なり合います。
マルチキャラクター制御のための一般的なタグ 自然で反応的な対話を書くための基本的なタグはこちらです:
順番交代の合図: [interrupting]、[overlapping]、[cuts in]感情の変化: [excited]、[annoyed]、[flustered]、[casual]リズムの流れ: [fast-paced]、[hesitates]、[pause]、[drawn out]アイデンティティの切り替え: [childlike tone]、[deep voice]、[pirate voice]、[robotic tone]これらを重ね合わせて表現豊かなやり取りを実現:[frustrated] あなたは私の話を聞かない — [interjecting] だってあなたは言いたいことを言わないから!
重なり、ペース、存在感 Eleven v3はタイミングを意識したデリバリーをサポートし、声が自然に中断したり重なったりすることが可能です。これはユーモアや緊張感、リアリズムに不可欠です。
この抜粋では:マリッサ:[パニック] 待って、私たち墜落してる?これが機能なのか— クリス:[中断] バグだ!マリッサ:[ため息] でも正直、これってちょっと楽しい。
シーンは流動的で、スクリプト化された順番ではなく、生き生きとしています。
単なる文ではなくシーンを演出 Eleven v3を使えば、対話シーンがオーケストラのようなパフォーマンスになります。1つのスクリプトと1つのモデルでキャラクター、タイミング、感情、デリバリーを含む会話全体を構築できます。
ストーリーテラー、ゲームライター、インタラクティブデザイナーにとって、追加の制作負担なしに複雑なシーンライティングが可能になります。単にセリフをスクリプト化するだけでなく、キャストのダイナミクスを演出しています。
適切な声の選択 プロフェッショナルボイスクローン(PVC)は現在、Eleven v3に完全に最適化されておらず、以前のモデルと比較してクローンの品質が低下する可能性があります。このリサーチプレビュー段階では、v3の機能を使用する必要がある場合、インスタントボイスクローン(IVC)やデザインされた声をプロジェクトに選ぶのが最善です。PVCのv3への最適化は近い将来に予定されています。