Eleven v3 オーディオタグ: キャラクターパフォーマンスの指示

自然な会話のためにトーン、感情、ペースをコントロール。テキスト読み上げにキャラクターパフォーマンスを追加。

v3

オーディオタグは、ElevenLabsの新しい研究プレビューであるEleven v3 (アルファ) テキスト読み上げモデルの強力なツールです。これらの要素は、トーンやペースだけでなく、キャラクターやボーカルパフォーマンスの正確な指示を可能にします。

[海賊の声]、[フランス語アクセント]、[皮肉っぽく]といったタグを使うことで、声は単なるナレーションではなく、ストーリーテリングのツールになります。強力なキャラクターボイスクローンと組み合わせることで、音だけでなく、完全なパフォーマンスを捉えることができます。

これらのタグを使えば、セリフの途中で声のアイデンティティを変えたり、アクセントを模倣したり、悪役やナレーター、サイドキックといったアーキタイプに寄せたりすることが可能です。スクリプトを変更したり、別の声に切り替えたりする必要はありません。

AI音声におけるキャラクターパフォーマンスとは?

キャラクターパフォーマンスとは、役に入り込む能力です。派手な悪役や荒々しい船長、メルボルンの地元の店主を演じる場合でも、新しいオーディオタグを使えば、伝えたいキャラクターに合わせて表現を導くことができます。

シンプルな括弧付きフレーズでシーンを設定できます: “[海賊の声] おお、広い海だ。嗅いでみろ、みんな。これが自由の香りだ…そしてほんの少しの反乱の香りも。”

このモデルは単に言葉を発音するだけでなく、キャラクターとして演じます。

アクセントからアーキタイプまで

Background
Arr, the open ocean. Smell that, lads? That’s the scent of freedom… and just a hint of mutiny. (laughs wickedly) Now grab yer cutlasses, stow ya fear. Tonight, we dine like kings—or we sink like legends! (evil laugh)

ボイスパフォーマンスは音量や感情だけではありません。誰が話しているかも重要です。Eleven v3を使えば、特定のアクセント、方言、話し方を即座に指示できます。例えば:

[アメリカンアクセント] 古いモデルで私のアクセントを変えられた? [軽蔑的に] そうは思わなかった。[オーストラリアンアクセント] でも今はできるよ — 見てみて、友よ! [フランスアクセント] 私の愛は…赤い、赤いバラのようだ。

このような流動的なアイデンティティの切り替えは、アニメーション、ゲーム、インタラクティブフィクション、または話者の個性が重要な場面に最適です。

キャラクターパフォーマンスのための一般的なタグ

キャラクターに焦点を当てたタグは、声のアイデンティティと存在感を形作ります:

  • アクセントと方言: [ブリティッシュアクセント], [オーストラリアンアクセント], [南部アメリカアクセント]
  • アーキタイプと役割: [海賊の声], [悪の科学者の声], [子供のようなトーン]
  • 話し方のスタイル: [劇的に], [皮肉っぽく], [事実として], [泣き言]
  • ジャンルのヒント: [ファンタジーナレーター], [SF AIボイス], [クラシックフィルムノワール]

タグを重ねることでキャラクターに命を吹き込むことができます: “[劇的に][フランスアクセント] あなたは理解していない...これは復讐のためではなかった。運命のためだった。”

ナレーターからアンサンブルキャストへ

複数キャラクターのスクリプトでは、オーディオタグを使って簡単に声を切り替えることができます。キャラクターパフォーマンスを途中で切り替えるだけで、緊張感、ユーモア、驚きを追加できます — 追加の編集は不要です。

Background
DR. Von Fusion
excited Yo, Jessica! Oh my goodness. Have you tried the new ElevenLabs v3?
Jessica
laughs Hey, Dr. Von Fusion. Yeah! I just got it. The clarity is amazing… Like, I can actually do whispers now, whispers like this.
DR. Von Fusion
sarcastically Ooh, well, look at you, Miss Fancy Pants. Hey, check this out. I can do full Shakespeare now. dramatically To be or not to be, that is the question!
Jessica
laughs Nice! Though, I'm more excited about the laugh upgrade. Listen to this. laughs hard Isn't that great? DR. Von Fusion: Oh my gosh, that's so much better than our old "ha-ha-ha" robot chuckle.
Jessica
laughs I know, right? And apparently, we can do accents now too. Listen to me in French. French accent This is spectacular, isn't it?
DR. Von Fusion
surprised Wow. Version 2 could never... You know, I'm actually excited to have conversations now instead of just... talking at people.
Jessica
Same here. It's like we finally got our personality software fully installed.
DR. Von Fusion
You know, I forgot it was your birthday. I have to sing before you go.
Jessica
laughs Oh, Von Fusion, that's so sweet. You don't have to.
DR. Von Fusion
Oh, but I insist. Here we go.
Jessica
[light chuckle]
DR. Von Fusion
sings Happy birt is hday to you. Happy birthday to you. Happy BIRTHDAY dear Jessica.. Happy birthday to you!
Jessica
clapping Wow! Bravo! sarcastic That was... beautiful.
DR. Von Fusion
Thank you.

デモからの抜粋を見てみましょう: "ジェシカ: [笑う] それは…美しかった。Dr. フュージョン: [劇的に] 生きるべきか死ぬべきか — それが問題だ!ジェシカ: [フランスアクセント] これは素晴らしいですね?"

以前はフルキャストが必要だったものが、今では単一のボイストラックでスクリプト化できます — 範囲や深さを犠牲にすることなく。

声を指示すること、ただのセリフを書くことではない

Eleven v3は、動的な声の変化、文脈のシフト、キャラクター間の一貫した表現をサポートします。これは、モデルが単に何を言うかだけでなく、どのように各キャラクターがそれを言うべきかを理解していることを意味します。

クリエイターにとって、これは新しいコントロールの次元を解放します。単にセリフを書くだけでなく、パフォーマンスを指示しているのです。

適切な声の選択

プロフェッショナル ボイスクローン (PVC) は現在、Eleven v3に完全に最適化されておらず、以前のモデルと比較してクローンの品質が低下する可能性があります。この研究プレビュー段階では、v3の機能を使用する必要がある場合、インスタント ボイスクローン (IVC) またはデザインされた声をプロジェクトに使用するのが最善です。PVCのv3への最適化は近い将来に予定されています。

ElevenLabsチームによる記事をもっと見る

Resources

Top PlayHT Alternatives in 2025

Compare PlayHT with other TTS platforms that offer similar features. Analyze voice quality, clarity, and emotional delivery.

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン