全新 Voice Design v3 上线
- 发布时间
我们很高兴推出 Voice Design v3。新版本让创建声音比以往更快、更简单、更直观。
Voice Design v3 适合需要特定声音的创作者、企业和开发者。只需描述想要的声音,系统会立即生成 3 个选项,选中喜欢的即可直接使用。
试试看,体验语音创建有多简单。
为什么 Voice Design 很重要

我们推出 Voice Design 的初衷很简单:让每位创作者都能生成专属声音,无需预订录音棚,也不用翻找音频库。v3 进一步提升了控制力、迭代速度和从创意到成品音频的流畅体验。
项目通常需要多种声音:冷静的旁白、紧张的配角、几个游戏 NPC,甚至会说话的浣熊。寻找“差不多”的声音会拖慢进度。
Voice Design v3 解决了这个难题。输入描述,生成 3 个候选,选一个即可继续——只按提示词字符计费,无需为每个样本单独付费。
v3 有哪些新功能
- 精准音质: 在提示词中加入“完美音质”等描述,v3 会自动匹配。如果想要收音机效果,也可以直接说明。音质由你掌控。
- 更智能的提示词引擎: v3 能理解细致描述,比如“中年纽约人,语调上扬,带点微笑”,不会出现杂音或失真。我们扩展了潜在空间,并用更多口音数据重新训练,让罕见组合也能自然呈现。
两种设计模式
- 真实语音设计 适合还原真实表现。例如:“一位声音柔和、语气平静的印度女性。”
- 角色语音设计 适用于精灵、神祇等各种角色。
一键生成三种声音
点击 生成,v3 会返回 3 个不同声音。选中喜欢的即可占用一个音色位,其余可丢弃。无需排队,无额外费用。
三步设计专属声音
- 确定角色设定: 声音扮演什么角色?简单勾勒人物形象。
- 精准提示: 用一句话描述年龄、口音、语气、语速和音质。例如:“完美音质。年长男性,浓重苏格兰口音,语速慢且富有思考,嗓音沙哑。”
- 保存并部署: 选择其中一个预览,可直接用于 ElevenLabs API 或网页工作室。
无需繁琐菜单,无隐藏选项,直接出结果。
提示词进阶技巧
以下是我们研究团队总结的高质量结果常用属性:
| Attribute | Why it matters | Example keywords |
|---|---|---|
| Age | Sets vocal texture and pitch | child, teen, middle-aged, elderly |
| Accent/nationality | Grounds the character in place | thick Australian, light French, neutral American |
| Gender | Guides resonance | male, female, gender-neutral |
| Tone & emotion | Drives delivery | warm, assertive, anxious, joyful |
| Speed | Controls pacing without editing | fast, measured, languid |
| Guidance scale | Balances creativity vs. prompt fidelity | “guidance scale 10” (try 8–12 for accuracy, 3–5 for exploration) |
完整属性矩阵请参见 提示词指南(文档中)。
关于表达清晰
最佳提示词就像日常对话——简短、具体、无术语。这也是我们的写作风格:能省则省。
实际应用场景

- 游戏开发: 用占位声音快速搭建支线任务,后续可随时替换,无需重新选角。
- 有声书和播客: 和播客:
- 本地化: 翻译对白时保持时长一致,同时生成符合文化的口音。
- 无障碍: 为屏幕阅读器和 IVR 系统打造符合品牌语调的声音,提升用户体验。
现已上线
Voice Design v3 已在 ElevenLabs 控制台上线:v3 已在 ElevenLabs 控制台上线:
登录,输入提示词,点击 生成。很快你就会拥有 3 个新声音——其中只有一个原本存在于你的脑海。
工作室见。





