
Fieldy.ai builds a wearable note taker powered by ElevenLabs
Fieldy.ai is using Scribe to power its new wearable note taker and increase retention by 50%
自然な会話のためにトーン、感情、ペースをコントロール。テキスト読み上げにキャラクターパフォーマンスを追加。
オーディオタグは、ElevenLabsの新しい研究プレビューであるEleven v3 (アルファ) テキスト読み上げモデルの強力なツールです。これらの要素は、トーンやペースだけでなく、キャラクターやボーカルパフォーマンスの正確な指示を可能にします。
[海賊の声]、[フランス語アクセント]、[皮肉っぽく]といったタグを使うことで、声は単なるナレーションではなく、ストーリーテリングのツールになります。強力なキャラクターボイスクローンと組み合わせることで、音だけでなく、完全なパフォーマンスを捉えることができます。
これらのタグを使えば、セリフの途中で声のアイデンティティを変えたり、アクセントを模倣したり、悪役やナレーター、サイドキックといったアーキタイプに寄せたりすることが可能です。スクリプトを変更したり、別の声に切り替えたりする必要はありません。
キャラクターパフォーマンスとは、役に入り込む能力です。派手な悪役や荒々しい船長、メルボルンの地元の店主を演じる場合でも、新しいオーディオタグを使えば、伝えたいキャラクターに合わせて表現を導くことができます。
シンプルな括弧付きフレーズでシーンを設定できます: “[海賊の声] おお、広い海だ。嗅いでみろ、みんな。これが自由の香りだ…そしてほんの少しの反乱の香りも。”
このモデルは単に言葉を発音するだけでなく、キャラクターとして演じます。
ボイスパフォーマンスは音量や感情だけではありません。誰が話しているかも重要です。Eleven v3を使えば、特定のアクセント、方言、話し方を即座に指示できます。例えば:
[アメリカンアクセント] 古いモデルで私のアクセントを変えられた? [軽蔑的に] そうは思わなかった。[オーストラリアンアクセント] でも今はできるよ — 見てみて、友よ! [フランスアクセント] 私の愛は…赤い、赤いバラのようだ。
このような流動的なアイデンティティの切り替えは、アニメーション、ゲーム、インタラクティブフィクション、または話者の個性が重要な場面に最適です。
キャラクターに焦点を当てたタグは、声のアイデンティティと存在感を形作ります:
タグを重ねることでキャラクターに命を吹き込むことができます: “[劇的に][フランスアクセント] あなたは理解していない...これは復讐のためではなかった。運命のためだった。”
複数キャラクターのスクリプトでは、オーディオタグを使って簡単に声を切り替えることができます。キャラクターパフォーマンスを途中で切り替えるだけで、緊張感、ユーモア、驚きを追加できます — 追加の編集は不要です。
デモからの抜粋を見てみましょう: "ジェシカ: [笑う] それは…美しかった。Dr. フュージョン: [劇的に] 生きるべきか死ぬべきか — それが問題だ!ジェシカ: [フランスアクセント] これは素晴らしいですね?"
以前はフルキャストが必要だったものが、今では単一のボイストラックでスクリプト化できます — 範囲や深さを犠牲にすることなく。
Eleven v3は、動的な声の変化、文脈のシフト、キャラクター間の一貫した表現をサポートします。これは、モデルが単に何を言うかだけでなく、どのように各キャラクターがそれを言うべきかを理解していることを意味します。
クリエイターにとって、これは新しいコントロールの次元を解放します。単にセリフを書くだけでなく、パフォーマンスを指示しているのです。
プロフェッショナル ボイスクローン (PVC) は現在、Eleven v3に完全に最適化されておらず、以前のモデルと比較してクローンの品質が低下する可能性があります。この研究プレビュー段階では、v3の機能を使用する必要がある場合、インスタント ボイスクローン (IVC) またはデザインされた声をプロジェクトに使用するのが最善です。PVCのv3への最適化は近い将来に予定されています。
Fieldy.ai is using Scribe to power its new wearable note taker and increase retention by 50%
ElevenLabs Conversational AI now supports WebRTC for improved conversation quality
Powered by ElevenLabs 会話型AI