跳到内容

使用 SynthID 检测 ElevenLabs 生成的音频

发布时间
最近更新

收听收听本文

用户有权知道自己是否在与 AI 互动。过去,AI 生成的内容很容易分辨——听起来很机械,或者有六根手指。但随着模型不断进步,现在已经越来越难判断。

随着我们的声音、音乐和音效模型不断提升,我们希望大家无需专业工具也能识别音频是否由 AI 生成。因此,我们与 Google DeepMind 合作推出 SynthID:一种直接嵌入由 ElevenLabs 生成音频的数字水印。该水印对人耳不可察觉,即使音频被裁剪、加速、去除元数据或转换为其他文件类型,也能保留。本周,我们已在文本转语音免费用户生成的音频中加入 SynthID,未来几周将覆盖所有 ElevenLabs 生成的音频。值得注意的是,这些水印可通过我们的全新免费工具

提升透明度与责任追溯

我们一直禁止利用我们的工具欺骗、操控或骚扰他人,系统也已设计为可追溯内容来源,便于采取相应措施。通过 SynthID 水印,公众可以验证音频片段的来源,进一步提升透明度和责任追溯。

有时,用户只想知道内容是否由 AI 生成;有时,还需要了解具体来自哪个 AI 平台。因此,我们今天上线了免费的 ElevenLabs 音频检测器 网页,方便大家验证音频是否由 ElevenLabs 生成。这是在我们现有 AI 语音分类器 的基础上,利用 SynthID 更稳健地将归属信息直接嵌入音频。这一机制有助于我们对技术能力保持公开责任,如遇恶意行为绕过我们完善的 安全措施 并制造出逼真的深度伪造内容时,能及时应对。

越来越多地区要求 AI 生成内容以机器可读格式标注为合成内容。SynthID 水印与我们现有的溯源和 合规 工具体系相辅相成,其中也包括 C2PA 认证。我们也期待将 SynthID 纳入 C2PA 软绑定列表,让被去除内容凭证的音频可以重新绑定。

高质量水印方案

SynthID 通过在音频片段中隐藏一组声音模式实现水印。该模式对人耳不可闻,但可被 ElevenLabs 音频检测器识别。每个音频文件都有独特的水印模式,并能在压缩、裁剪、变速等常见音频处理后依然保留。

SynthID 在我们的基准测试中表现优异,满足所有技术要求:

  • 不会增加首字节延迟(TTFB)
  • 检测率高,误报率低
  • 能抵抗裁剪等常见在线音频处理
  • 对人耳完全无感知,不影响音质
  • 无法复制到非 ElevenLabs 生成的音频上

我们将继续与 Google DeepMind 的 SynthID 团队合作,推动音频水印技术发展。

后续计划

水印主要用于提升透明度和责任追溯,同时也带来新的产品能力。数字内容凭证市场已相当成熟——工作室用它保护知识产权,创作者用它确保作品被二次使用时能获得报酬。未来,水印还可能让创作者和 IP 持有者将自有元数据直接嵌入内容,便于在 YouTube、Instagram、TikTok 等平台检测和处理被重新分发的版权内容。

水印只是我们透明承诺的一部分。随着模型越来越强大、逼真,我们的责任体系也需同步提升。内容归属越清晰,信息生态就越值得信赖。

相关内容

用高质量 AI 音频创作