跳到内容

Eleven v3 音频标签:引导角色表现

灵活控制语气、情感和语速,让对话更自然。为文本转语音添加角色表现。

v3

音频标签是 Eleven v3(alpha)中强大的工具,这是 ElevenLabs 最新的文本转语音研究预览模型。这些元素不仅能精准控制语气和语速,还能引导角色和声音表现。

通过类似 [pirate voice]、[French accent] 或 [sarcastically] 这样的标签,声音不再只是叙述工具,更能讲故事。结合高质量的角色语音克隆,不只是还原声音,更能呈现完整表演。

这些标签让你可以在一句话中切换声音身份、模仿口音,或塑造反派、旁白、配角等角色,无需更改脚本或切换音色。

AI 语音中的角色表现是什么?

角色表现就是进入某个角色。不管是夸张的反派、粗犷的船长,还是墨尔本的小店主,全新音频标签都能让你引导表达,贴合想要呈现的人物形象。

只需简单加上方括号标签,就能设定场景:“[pirate voice] Arr,大海无垠。闻到了吗,伙计们?那是自由的味道……还有一丝叛变的气息。”

模型不仅仅是读出单词,而是以角色身份来表演。

从口音到角色类型

Background

声音表现不仅仅是音量或情感,更关乎“谁”在说话。通过 Eleven v3,可以随时切换口音、方言和说话风格。例如:

[American accent] 旧模型能切换口音吗?[dismissive] 我就知道不行。[Australian accent] 但现在可以了——来看看吧,伙计![French accent] 我的爱……就像一朵红玫瑰。

这种灵活切换身份的能力,非常适合动画、游戏、互动小说等需要突出角色个性的场景。

常用角色表现标签

以角色为核心的标签可以塑造声音身份和表现力:

  • 口音与方言: [British accent]、[Australian accent]、[Southern US accent]
  • 角色类型: [pirate voice]、[evil scientist voice]、[childlike tone]
  • 说话风格: [dramatic]、[sarcastically]、[matter-of-fact]、[whiny]
  • 风格提示: [fantasy narrator]、[sci-fi AI voice]、[classic film noir]

叠加标签能让角色更生动:“[dramatic][French accent] 你不明白……这从来不是为了复仇,而是命运。”

从旁白到多角色表演

在多角色剧本中,音频标签让切换声音变得简单。只需在对话中切换角色表现,就能增加紧张感、幽默或惊喜,无需额外剪辑。

Background

以下是演示片段: “Jessica: [laughs] 太美了。Dr. Von Fusion: [dramatic] 生存还是毁灭——这是个问题!Jessica: [French accent] 太精彩了,不是吗?”

过去需要整组配音演员,现在只需一条音轨就能实现丰富表现,且不损失层次感。

不仅仅是写台词,更是引导演绎

Eleven v3 支持动态切换声音、上下文变化和角色间一致表达。也就是说,模型不仅理解内容,还知道方式每个角色该如何表达。

对创作者来说,这带来了全新控制维度。不只是写对话,更是在导演表演。

选择合适的声音

目前专业语音克隆(PVC)在 Eleven v3 上还未完全优化,克隆质量可能低于早期模型。在此研究预览阶段,如需使用 v3 功能,建议选择即时语音克隆(IVC)或设计声音。PVC 针对 v3 的优化即将上线。

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作