Eleven v3 アルファのご紹介

v3を試す

Eleven v3 オーディオタグとは何か — そしてその重要性

ElevenLabsのオーディオタグは、AI音声の感情、ペース、サウンドエフェクトを制御します。

Audio tags

リリースに伴い、Eleven v3、オーディオプロンプトが重要なスキルになりました。AI音声に言わせたい言葉を入力したり貼り付けたりする代わりに、新しい機能を使うことができます — オーディオタグ — 感情から表現までをコントロール。

Eleven v3 はアルファ版のリサーチプレビュー新しいモデルの。これにはより多くのプロンプトエンジニアリングが必要ですが、生成されるものは驚くべきものです。

ElevenLabsのオーディオタグは、角括弧で囲まれた単語で、新しいEleven v3モデルが解釈し、音声アクションを指示するために使用します。[excited]、[whispers]、[sighs]から[gunshot]、[clapping]、[explosion]まで、さまざまなものがあります。

オーディオタグを使えば、AI音声の音を形作ることができ、トーンや間、ペースなどの非言語的な要素も含まれます。没入型のオーディオブックやインタラクティブなキャラクター、対話型メディアを構築する際に、これらのシンプルなスクリプトレベルのツールで感情と表現を正確にコントロールできます。

オーディオタグでのパフォーマンス指示

スクリプトのどこにでもオーディオタグを配置して、リアルタイムで表現を形作ることができます。スクリプトや文の中でタグを組み合わせて使用することも可能です。タグは主に以下のカテゴリーに分かれます。

感情

これらのタグは、声の感情的なトーンを設定するのに役立ちます。例えば、[sad]、[angry]、[happily]、[sorrowful]の一つまたは組み合わせを使用できます。

Background
sorrowful I couldn't sleep that night. The air was too still, and the moonlight kept sliding through the blinds like it was trying to tell me something. quietly And suddenly, that's when I saw it.
Background
Okay, you are not going to believe this. You know how I've been totally stuck on that short story, like staring at the screen for HOURS, just... nothing? sigh I was seriously about to just trash the whole thing - start over - give up probably, but then laughs last night I was just doodling, not even thinking about it, right? And this one little phrase popped into my head, just completely out of the blue, and it wasn't even for the story initially. But then I typed it out just to see, and it was like the FLOODGATES opened. Suddenly I knew exactly where the character needed to go, what the ending had to be. It all just - clicked. sigh I stayed up till like 3:00 AM, just typing like a maniac, didn't even stop for coffee. light chuckle And it's, it's GOOD, like really good. It feels so complete now, you know, like it finally has a soul. I am so incredibly pumped to finish editing it now. It went from feeling like a chore to feeling like MAGIC. Seriously, I'm still buzzing.

表現の指示

これらはトーンやパフォーマンスに関するものです。シーンに応じて音量やエネルギーを調整するために使用できます。例としては、[whispers]、[shouts]、さらには[x accent]などがあります。

Background
Could you switch my accent in the old model? dismissive didn't think so. cheeky but you can now! so, Check this out...In just a sec, I'm gonna to speak with a different accent.. and just between you and me whispers I don't really know how. chuckles but ok.. first let's change it up... Australian accent so that I can fit in with the locals in Melbourne when I visit next month! laughs hard Woooo! yeah man, this - is - sick. Ok, let's try a different one - see if you can guess... strong French accent My love... eez like a red, red rose..
Background
Marissa
starting to speak So I was thinking we could—
Chris
jumping in —test our new timing features?
Marissa
surprised Exactly! How did you—
Chris
overlapping —know what you were thinking? Lucky guess! Sorry, go ahead.
Marissa
cautiously Okay, so if we both try to talk at the same time—
Chris
—we'll probably crash the system!
Marissa
panicking Wait, are we crashing? I can't tell if this is a feature or a—
Chris
interrupting Bug! ...Did I just cut you off again?
Marissa
sighing Yes, but honestly? This is kind of fun.

人間の反応

自然なスピーチには反応が含まれます。例えば、自然で即興的な瞬間をスピーチに組み込むことでリアリズムを追加できます。例としては、[laughs]、[clears throat]、[sighs]があります。

Background
We're off under the lights here for this semi-final clash, the stadium buzzing with anticipation. ElevenLabs United in their iconic black and white shirts, pushing forward with intent straight from the opening whistle. excited The ball is zipped out wide, early attack here. Driving down the wing, pace to Bernie, shouting skips past one, skips past two! Oh, this is beautiful. One-on-one with the full-back, cuts inside—oh, that's a lovely bit of footwork!!! PURE MAGIC on the pitch! ElevenLabs on top form tonight!
Background
Oh my God. laughs You guys, like no joke, I just tried this TTS thing and it was, like, weirdly emotional. Like it literally said, "Hi," and I was, like, on the verge of tears. laughs I don't even cry, okay? I'm a Capricorn.

より表現力豊かなモデルに基づく

これらの機能の基盤となるのは、v3の新しいアーキテクチャです。このモデルはテキストの文脈をより深く理解し、感情の手がかりやトーンの変化、話者の移行をより自然に追従します。オーディオタグと組み合わせることで、以前のTTSでは不可能だった表現力を解放します。

今では、マルチスピーカーダイアログを作成でき、即興的に感じられる会話を実現します。中断やムードの変化、会話のニュアンスを最小限のプロンプトで処理します。

今すぐ利用可能

プロフェッショナル ボイスクローン (PVC) は現在、Eleven v3 に完全には最適化されておらず、以前のモデルと比べてクローンの品質が低下する可能性があります。このリサーチプレビュー段階では、v3 の機能を使用する必要がある場合、インスタント ボイスクローン (IVC) やデザインされたボイスをプロジェクトに使用するのが最善です。PVC の v3 への最適化は近いうちに行われます。80% off until the end of June. Public API for Eleven v3 (alpha) is coming soon. For early access, please contact sales. Whether you’re experimenting or deploying at scale, now’s the time to explore what’s possible.

ElevenLabsチームによる記事をもっと見る

ElevenLabs

最高品質のAIオーディオで制作を

無料で始める

すでにアカウントをお持ちですか? ログイン