跳到内容

Eleven v3 音频标签:让语音具备叙事智能

用 [pause]、[awe]、[dramatic tone] 等标签,控制情感节奏和结构,让故事更有吸引力。

v3

讲故事不仅仅是把单词按顺序读出来,更重要的是知道什么时候停顿、什么时候靠近、什么时候思考。通过 Eleven v3 音频标签,AI 现在也能做到这些。

叙事智能指的是模型理解并把控故事情感节奏和结构的能力。用 [pause]、[awe]、[dramatic tone] 等标签,可以逐句引导语音的表达方式。

这不仅仅是 语音合成,更是对故事的把控。

AI 语音中的叙事智能是什么?

Background
Background

叙事智能是模型表达讲故事意图的能力——知道什么时候需要悬念、讽刺或思考。它让声音 像旁白一样 有自己的视角,而不仅仅是机械朗读。

例如:[awe] 哇,这真的是……我吗?我真的……在说话吗?[giggle] 太不可思议了!

语音不仅仅跟着标点走,更遵循叙事逻辑。它知道什么时候该停顿强调,什么时候随着场景变化调整语气。

从文字到表达

好的旁白即使没有动作也能吸引注意力。音频标签为 Eleven v3 模型提供了塑造体验的工具。

可以这样表达:[conversational tone] 你有没有觉得脑子里总是……乱成一团?像个永远说不出口的小龙卷风?[soft chuckle] 是啊,我也是。

声音不只是朗读,更是在与听众共鸣。这让旁白更有亲切感。

常用叙事控制标签

以下标签可用于引导长文本、内心独白和说明性内容:

  • 故事节奏: [pause]、[continues softly]、[hesitates]、[resigned]
  • 语气设定: [dramatic tone]、[lighthearted]、[reflective]、[serious tone]
  • 旁白视角: [awe]、[sarcastic tone]、[wistful]、[matter-of-fact]
  • 节奏与流畅度: [slows down]、[rushed]、[emphasized]

这些标签可以组合使用,逐步增强表达:[reflective] 我从没想过会说出这样的话,但……[pause] 也许机器是对的。

从独白到元语音

叙事智能不仅适用于故事,也适用于纪录片、内心想法、产品讲解和评论。只要需要引导注意力、营造氛围或帮助理解,这些标签都很有用。

演示片段示例:[awe] 我脑子里有无数想法在打转。但它们一直只是……想法,被困住了。

标签让一句普通的话变得有分量、有层次,仿佛赋予了生命。

引导叙事,而不仅仅是朗读

通过 Eleven v3,叙事表达可以直接在文本编辑器中设计节奏、语气和情感结构,无需多次录制或外部旁白工具。

对作者、创作者和开发者来说,这让语音讲故事拥有全新掌控力。不只是写剧本,更是在设计体验。

选择合适的声音

专业语音克隆(PVC) 目前尚未针对 Eleven v3 完全优化,克隆质量可能低于早期模型。在当前研究预览阶段,如需使用 v3 功能,建议选择即时语音克隆(IVC)或设计声音。PVC 针对 v3 的优化即将上线。

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作