
人声分离 API 上线
- 分类
- ElevenAPI
- 日期
了解 ElevenLabs 如何打造 SB1,这是一款由文本音效 AI 音频模型驱动的无限音效板,用户可随时生成任意声音。
想象一下,一块可以随时生成无限声音的音效板。这正是我们在 ElevenLabs 打造的——这就是 SB1,我们的 无限音效板。表面上看,它就是一组可以点击或用快捷键触发的音效格。实际上,背后由我们的 文本音效生成 AI 音频模型驱动。
使用方法很简单,只需描述你想要的任何声音,SB1 就能生成。也有一些默认声音预设,甚至这些也可以随时替换。
我们最初提出了一个简单的问题:如果你可以输入描述,比如“柔和的森林环境音”或“观众惊呼”,就能直接获得可用的音效,会怎样?
传统音效板依赖于网上搜集的 MP3 库。即使找到了合适的声音,往往也不是你真正想要的。但有了生成式 AI,这些都不再是问题,完全不受限制。

在正式写代码前,我们找到了 亲切,做了一个 SB1 的基础原型。虽然还没接入 API,但让我们可以先尝试不同的设计和按钮布局,之后团队再完善最终的界面和代码。
我们想要的是动态内容——任意声音,随时生成。核心就是 ElevenLabs SFX API。API 只需一个接口:
只需发送包含提示词、需要的变体数量(默认 4 个)和 API key(放在 Authorization header) 的 JSON。
返回结果是一个包含生成 WAV 文件链接的数组。你可以直接在线播放、下载,或分配到音效格上。还支持循环播放。描述越详细,生成效果越好。
/v1/sound-effects/generateAuthorization: Bearer YOUR_API_KEYContent-Type: application/jsonprompt (string): description of the soundn (integer): number of variations (1–10)format (string, optional): wav or mp3 (defaults to wav)示例请求如下:
你会收到 4 个链接组成的数组。API 设计可适配各种场景——无论是临时创建音效板,还是批量生成游戏素材。
API 搭建好后,我们开始做前端。SB1 是用 React 和 Tailwind CSS 构建的网页应用。每个音效格有两种模式:
在自定义模式下点击空白音效格,会弹出提示框。输入描述,点击 生成,API 会返回 4 个选项。你可以直接试听,选中喜欢的,音效格会立即更新。还支持键盘快捷键触发,方便现场演奏或实时音效。
我们还加了循环播放功能。只需按下循环按钮,点选想循环的声音,就会一直播放,直到松开。SB1 不仅适合玩笑、鼓机、环境氛围,也适合播客、直播音效、冥想引导等场景。
我们通过输入“小雨滴落在树叶上”“柔和的海浪拍打岸边”等提示词生成这些声音,再设置循环,营造专注或冥想的背景音。
无需鼓样本库,只需描述“低音很重的 808 踢鼓”或“紧致的军鼓声”,API 就会给出 4 个版本试听。我们把它们映射到 A、S、D 键,现场演示演奏。
如果想进一步挑战模型,还可以用它生成角色语音片段。只需指定角色,再把台词放在括号里。
可以保存并命名自己的预设,比如“直播特效”,包含惊呼、笑声、掌声等。搭建好音效板后,点击 分享,即可复制链接或直接分享到社交平台。任何人通过链接都能加载你的 SB1 配置,播放你精选的声音。
想自己试试,查看我们的文档。文档中有 JavaScript、Python、cURL 等代码示例,教你如何集成 SFX API 到项目中。
SB1 只是我们音效模型的一个演示。我们正在开发 OBS 和数字音频工作站插件,让你无需离开直播或制作软件就能生成新声音。同时也在优化模型,提升音乐相关提示词的表现,比如异域打击乐或合成器音色。
如果你做了有趣的项目,欢迎分享给我们。可以在社交平台 @我们,或直接分享预设链接。无论你是主播、播客、游戏开发者,还是喜欢玩声音的用户,SB1 和 SFX API 都能让你随时释放音频创意。
立即免费试用 ——无需音效库。