素晴らしいスピーチは内容だけでなく、どのように伝えるかが重要です。 Eleven v3 オーディオタグ を使えば、タイミング、リズム、強調を細かくコントロールでき、セリフのペースを精密に調整できます。
[pause]、[rushed]、[stammers]、[drawn out]のようなタグを使って、感情だけでなくリズム的にも各文の着地を調整できます。このコントロールが平坦なデリバリーをパフォーマンスに変えます。
AI音声におけるデリバリーコントロールとは? デリバリーコントロールとは、スピーチの流れを指示する能力です。どのくらい速く進むか、どこで止まるか、いつ強調するかを決めることができます。これにより、セリフがドラマチック、カジュアル、緊張感、またはコメディックに感じられます。
Eleven v3 では、デフォルトのペースに縛られずに配信できます。スクリプトから直接、サスペンスのために遅くしたり、緊急性のために速くしたり、ユーモアのためにリズムを加えたりできます。
再生 例:「オーケー、だからやっとあのゲームのレベル42をクリアしたんだよ、やめるって言ってたのに... 一ヶ月前に。[笑] そして最後のボスは... ただの... [くすくす] ウサギだった。[大笑い] できなかったよ。可愛すぎた。」
ここでのタグはテンポとタイミングを形作ります。それがセリフを際立たせるのです。
タイミング、ペース、存在感のコントロール タグを使うことで、人間が自然にスピーチをペースするための微妙な手がかりにアクセスできます:
ポーズとブレイク: [pause]、[breathes]、[continues after a beat]スピードの手がかり: [rushed]、[slows down]、[deliberate]、[rapid-fire]ためらいとリズム: [stammers]、[drawn out]、[repeats]、[timidly]強調: [emphasized]、[stress on next word]、[understated]例:「[drawn out] だから... 君は... [疑わしいトーン] 最後の一切れを食べてないって言うの?」
これらのタグは、声がどのように感じられるか を完全にコントロールします。
トーンと意味のためのペース設定
再生 セリフの伝え方を変えると、その解釈も変わります。
比較: 大丈夫です。 [平坦に] 大丈夫です。 [静かに、ポーズの後で] 大丈夫... です。 [怒って、うんざりして] 大丈夫だってば! [疑問に思って] 本当に [ポーズ] 大丈夫? 大丈夫です。[ポーズ] 本当に! 同じ言葉でも、意味は異なります。デリバリーコントロールを使えば、トーンは言葉の選択ではなく、タイミングと意図から生まれます。
瞬間を定義するタグの組み合わせ
再生 デリバリーに焦点を当てたタグを感情やキャラクターの手がかりと組み合わせて、シーン全体を形作ることができます。
例:[ためらい][緊張] 私... これがうまくいくかどうか分からない。[ごくり] でも、とにかくやってみよう。
または:[ささやき][ポーズ] 聞こえた?[急いで] 隠れて!今すぐ!
このリズムと反応の組み合わせが、パフォーマンスを信じられるものにします。
テキストだけでなくテンポを指示 Eleven v3はスクリプトをスコアに変え、デリバリーコントロールでそれを指揮します。チュートリアル、モノローグ、パンチラインをスクリプト化する際、オーディオタグを使えばフレーム単位でデリバリーを管理できます。
クリエイターにとって、これはセリフの展開を完全に指揮できることを意味します。何が起こるかを書くのではなく、そのテンポを設定するのです。
適切な声の選択 プロフェッショナルボイスクローン(PVC)は現在、Eleven v3に完全に最適化されておらず、以前のモデルに比べてクローンの品質が低下する可能性があります。このリサーチプレビュー段階では、v3の機能を使用する必要がある場合、インスタントボイスクローン(IVC)やデザインされた声をプロジェクトに選ぶのが最善です。PVCのv3への最適化は近い将来に予定されています。