跳到内容

Eleven v3 音频标签:精准控制 AI 语音表现

通过 Eleven v3 音频标签,精细调控语音的时机、节奏和重音。让平淡的语音变得生动有表现力。

v3

优秀的语音不仅在于内容,更在于表达方式。使用 Eleven v3 音频标签,可以精准控制语音的时机、节奏和重音,自由调整语句的节奏。

通过 [pause]、[rushed]、[stammers] 或 [drawn out] 等标签,可以调整每句话的情感和节奏,让语音更具表现力。

什么是 AI 语音的表现控制?

表现控制指的是掌控语音流畅度——包括语速、停顿和重音。它让语句可以变得更有戏剧性、随意、紧张或幽默。

有了 Eleven v3,语音节奏不再受限于默认设置。可以为悬念放慢语速,为紧急加快节奏,或为幽默添加节奏感——直接在脚本中实现。

Background

示例:“好吧,其实我终于通关了那个我说要弃坑的游戏第 42 关……大概一个月前吧。[laughs] 然后最终 boss……其实就是……[giggle] 一只兔子。[big laugh] 我真的下不去手,太可爱了。”

这些标签决定了语音的节奏和时机,让表达更自然。

控制时机、节奏和表现力

标签让你掌握人类自然表达语音时的细微节奏:

  • 停顿与间隔: [pause]、[breathes]、[continues after a beat]
  • 语速提示: [rushed]、[slows down]、[deliberate]、[rapid-fire]
  • 犹豫与节奏: [stammers]、[drawn out]、[repeats]、[timidly]
  • 重音: [emphasized]、[stress on next word]、[understated]

示例:“[drawn out] 所以……你是说……[suspicious tone] 你没吃最后一块?”

这些标签让你完全掌控声音的表现力和流动感。

用节奏表达语气和含义

Background

改变语句的表达方式,会影响听众的理解。

对比:

  • 我没事。
  • [flatly] 我没事。
  • [quietly, after a pause] 我……没事。
  • [angrily, fed up] 我没事!
  • [questioning]你 [pause] 确定没事?
  • 我没事。[pause] 真的!

同样的话,不同的表达。通过表现控制,语气不再只靠用词,而是由时机和意图决定。

多标签组合,定义场景氛围

Background

可以将表现标签与情感或角色提示结合,塑造完整场景。

示例:[hesitant][nervous] 我……我不确定这样行不行。[gulps] 但还是试试吧。

或:[whispering][pause] 你听到了吗?[rushed] 快躲起来!

正是这种节奏与反应的结合,让语音表演更真实。

不仅控制文本,更掌控节奏

Eleven v3 让脚本变成乐谱,表现控制就是你的指挥棒。不论是教程、独白还是笑点,音频标签都能让你逐句精准把控表达。

对创作者来说,这意味着可以完全掌控语句的展开方式。不只是写内容,更能设定节奏。

选择合适的音色

专业语音克隆(PVC)目前尚未完全适配 Eleven v3,克隆质量可能低于早期模型。在当前研究预览阶段,如需使用 v3 功能,建议选择即时语音克隆(IVC)或设计音色。PVC 对 v3 的优化即将上线。

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作