Eleven v3 アルファのご紹介

v3を試す

Eleven v3 オーディオタグ: キャラクターの演技を音声で指示

自然な会話のためにトーン、感情、テンポをコントロール。テキスト読み上げにキャラクターの演技を追加。

v3

Audio Tagsは、ElevenLabsの新しい研究プレビューであるEleven v3 (アルファ)のテキスト読み上げモデルにおける強力なツールです。これにより、トーンやペースだけでなく、キャラクターや声のパフォーマンスに対しても正確な指示が可能になります。

[海賊の声]、[フランス語アクセント]、[皮肉っぽく]といったタグを使うことで、声は単なるナレーションではなく、ストーリーテリングのツールになります。強力なキャラクターボイスクローンと組み合わせることで、音だけでなく、完全なパフォーマンスを捉えることができます。

これらのタグを使うことで、セリフの途中で声のアイデンティティを変えたり、アクセントを模倣したり、悪役やナレーター、サイドキックといったアーキタイプに寄せたりすることが可能です。スクリプトを変更したり、別の声に切り替えたりする必要はありません。

AI音声におけるキャラクターパフォーマンスとは?

キャラクターパフォーマンスとは、役に入り込む能力です。派手な悪役や荒々しい船長、メルボルンの地元の店主を演じる際、新しいAudio Tagsを使えば、伝えたいキャラクターに合わせて表現を導くことができます。

シンプルな括弧付きのフレーズでシーンを設定できます: “[海賊の声] おお、広い海だ。嗅いでみろ、みんな。これが自由の香りだ…そして反乱の匂いも少し。”

このモデルは単に言葉を発音するだけでなく、キャラクターとして演じます。

アクセントからアーキタイプまで

Arr, the open ocean. Smell that, lads? That’s the scent of freedom… and just a hint of mutiny. (laughs wickedly) Now grab yer cutlasses, stow ya fear. Tonight, we dine like kings—or we sink like legends! (evil laugh)

声のパフォーマンスは音量や感情だけではありません。誰が話しているかも重要です。Eleven v3を使えば、特定のアクセントや方言、話し方を即座に指示できます。例えば:

[アメリカンアクセント] 古いモデルでアクセントを変えられた? [軽蔑的に] そうは思わなかったよ。[オーストラリアンアクセント] でも今はできるよ — 見てみて、友よ! [フランスアクセント] 私の愛は…赤い、赤いバラのようだ。

このような流動的なアイデンティティの切り替えは、アニメーション、ゲーム、インタラクティブフィクション、または話者の個性が重要な場面に最適です。

キャラクターパフォーマンスのための一般的なタグ

キャラクターに焦点を当てたタグは、声のアイデンティティと存在感を形作ります:

  • アクセントと方言: [ブリティッシュアクセント], [オーストラリアンアクセント], [南部アメリカアクセント]
  • アーキタイプと役割: [海賊の声], [悪の科学者の声], [子供のようなトーン]
  • 話し方のスタイル: [ドラマチックに], [皮肉っぽく], [事実を述べるように], [泣き言を言うように]
  • ジャンルのキュー: [ファンタジーナレーター], [SF AIボイス], [クラシックフィルムノワール]

タグを重ねることでキャラクターに命を吹き込むことができます: “[ドラマチックに][フランスアクセント] あなたは理解していない…これは復讐のためではなかった。運命のためだったのだ。”

ナレーターからアンサンブルキャストへ

複数キャラクターのスクリプトでは、Audio Tagsを使うことで声を簡単に切り替えることができます。対話の途中でキャラクターパフォーマンスを切り替えるだけで、緊張感やユーモア、驚きを加えることができ、追加の編集は不要です。

DR. Von Fusion
excited Yo, Jessica! Oh my goodness. Have you tried the new ElevenLabs v3?
Jessica
laughs Hey, Dr. Von Fusion. Yeah! I just got it. The clarity is amazing… Like, I can actually do whispers now, whispers like this.
DR. Von Fusion
sarcastically Ooh, well, look at you, Miss Fancy Pants. Hey, check this out. I can do full Shakespeare now. dramatically To be or not to be, that is the question!
Jessica
laughs Nice! Though, I'm more excited about the laugh upgrade. Listen to this. laughs hard Isn't that great? DR. Von Fusion: Oh my gosh, that's so much better than our old "ha-ha-ha" robot chuckle.
Jessica
laughs I know, right? And apparently, we can do accents now too. Listen to me in French. French accent This is spectacular, isn't it?
DR. Von Fusion
surprised Wow. Version 2 could never... You know, I'm actually excited to have conversations now instead of just... talking at people.
Jessica
Same here. It's like we finally got our personality software fully installed.
DR. Von Fusion
You know, I forgot it was your birthday. I have to sing before you go.
Jessica
laughs Oh, Von Fusion, that's so sweet. You don't have to.
DR. Von Fusion
Oh, but I insist. Here we go.
Jessica
[light chuckle]
DR. Von Fusion
sings Happy birt is hday to you. Happy birthday to you. Happy BIRTHDAY dear Jessica.. Happy birthday to you!
Jessica
clapping Wow! Bravo! sarcastic That was... beautiful.
DR. Von Fusion
Thank you.

デモからの抜粋を見てみましょう: "ジェシカ: [笑い] それは…美しかった。Dr. Von Fusion: [ドラマチックに] 生きるべきか死ぬべきか — それが問題だ!ジェシカ: [フランスアクセント] これは素晴らしいですね?"

以前はフルキャストが必要だったものが、今では単一のボイストラックでスクリプト化でき、レンジや深みを犠牲にすることはありません。

声を指導すること、ただのセリフを書くことではなく

Eleven v3は、動的な声の変化、文脈のシフト、キャラクター間での一貫した表現をサポートします。これにより、モデルは単に何を言うかだけでなく、どのように各キャラクターが言うべきかを理解します。

クリエイターにとって、これは新しい次元のコントロールを解放します。単に対話をスクリプト化するだけでなく、パフォーマンスを指導することができます。

適切な声の選択

プロフェッショナル ボイスクローン (PVC) は現在、Eleven v3に完全には最適化されておらず、以前のモデルと比較してクローンの品質が低下する可能性があります。この研究プレビュー段階では、v3の機能を使用する必要がある場合、インスタント ボイスクローン (IVC) またはデザインされた声をプロジェクトに使用するのが最善です。PVCのv3への最適化は近い将来に予定されています。

もっと見る

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン