Voice Design - 首个音频生成式 AI

收听收听本文

0:00

0:000:00

上个月我们宣布即将推出用于声音创作的生成式模型。现在终于上线，这是同类首创，我们称之为声音设计。该功能可让你从零开始创建新声音，自定义性别、年龄、口音等核心特征。即使核心参数相同，每次生成时模型也会加入随机性，确保每个声音都独一无二。

Voice Design 背后的模型主要基于我们在语音合成和

为声音选择增加一定的可控性很重要，因为用户经常需要特定的语音特征来配合脚本。确保每个生成的声音都独特同样关键，许多场景需要或受益于专属声音。除了为用户提供新的创作方式，Voice Design 生成的声音完全为人工合成，不属于任何真实人物。

除了用我们的核心语音合成工具轻松将文字转为高质量音频外，图书作者现在可以用 Voice Design 自由把控旁白风格，为每个角色定制专属声音。

新闻出版方进入音频领域时需要为报道选择合适的声音。旁白往往代表媒体形象，选定后很少更换。Voice Design 让出版方可以即时挑选、对比无数旁白，还能确保专属声音只代表自己。

游戏开发者无需再为某个角色是否值得录音而纠结。成千上万个原本无声的 NPC 现在都能拥有独特个性，进一步提升虚拟沉浸感。

无论你是内容创作者准备发布新作，还是企业管理者需要为公司沟通配音，现在都能为不同场景和受众设计真实、有吸引力的音频，可能性无限。

Voice Design 是我们今年计划推出的多项旁白编辑功能之一。接下来将上线工作室，这是我们全新的工作台，可用于整理长文本、插入停顿、重新生成音频片段、为不同说话人分配文本。Studio 预计 3 月底上线，第二季度还将支持语调编辑。

相关内容