跳到内容

我们如何用 ElevenLabs SFX API 创建无限音效板

了解 ElevenLabs 如何打造 SB1,这是一款由文本音效 AI 音频模型驱动的无限音效板,用户可随时生成任意声音。

SB1

想象一下,一块可以随时生成无限声音的音效板。这正是我们在 ElevenLabs 打造的——这就是 SB1,我们的 无限音效板。表面上看,它就是一组可以点击或用快捷键触发的音效格。实际上,背后由我们的 文本音效生成 AI 音频模型驱动。

使用方法很简单,只需描述你想要的任何声音,SB1 就能生成。也有一些默认声音预设,甚至这些也可以随时替换。

从想法到原型

我们最初提出了一个简单的问题:如果你可以输入描述,比如“柔和的森林环境音”或“观众惊呼”,就能直接获得可用的音效,会怎样?

传统音效板依赖于网上搜集的 MP3 库。即使找到了合适的声音,往往也不是你真正想要的。但有了生成式 AI,这些都不再是问题,完全不受限制。

SB1 Prototype

在正式写代码前,我们找到了 亲切,做了一个 SB1 的基础原型。虽然还没接入 API,但让我们可以先尝试不同的设计和按钮布局,之后团队再完善最终的界面和代码。

我们想要的是动态内容——任意声音,随时生成。核心就是 ElevenLabs SFX API。API 只需一个接口:

POST https://api.elevenlabs.io/v1/sound-generation

只需发送包含提示词、需要的变体数量(默认 4 个)和 API key(放在 Authorization header) 的 JSON。

返回结果是一个包含生成 WAV 文件链接的数组。你可以直接在线播放、下载,或分配到音效格上。还支持循环播放。描述越详细,生成效果越好。

Key API details

  • Headers:
    • Authorization: Bearer YOUR_API_KEY
    • Content-Type: application/json
  • Body parameters:
    • prompt (string): description of the sound
    • n (integer): number of variations (1–10)
    • format (string, optional): wav or mp3 (defaults to wav)

示例请求如下:

{
  "prompt": "rain hitting the roof of a tent",
  "n": 4,
  "format": "wav"
}

你会收到 4 个链接组成的数组。API 设计可适配各种场景——无论是临时创建音效板,还是批量生成游戏素材。

SB1 界面开发

API 搭建好后,我们开始做前端。SB1 是用 React 和 Tailwind CSS 构建的网页应用。每个音效格有两种模式:

  1. 预设:从已保存的音效链接加载
  2. 自定义:通过 SFX API 用户自定义生成

在自定义模式下点击空白音效格,会弹出提示框。输入描述,点击 生成,API 会返回 4 个选项。你可以直接试听,选中喜欢的,音效格会立即更新。还支持键盘快捷键触发,方便现场演奏或实时音效。

我们还加了循环播放功能。只需按下循环按钮,点选想循环的声音,就会一直播放,直到松开。SB1 不仅适合玩笑、鼓机、环境氛围,也适合播客、直播音效、冥想引导等场景。

实际效果示例

环境音景

  • 小雨:“小雨滴落在树叶上”
 / 
  • 大雨:“大雨落在铁皮屋顶”
 / 
  • 海浪:“柔和的海浪拍打岸边”
 / 

我们通过输入“小雨滴落在树叶上”“柔和的海浪拍打岸边”等提示词生成这些声音,再设置循环,营造专注或冥想的背景音。

鼓机

  • 808 踢鼓:“低音很重的 808 踢鼓”
 / 
  • 军鼓:“紧致的军鼓声”
 / 
  • 开放镲片:“开放镲片延音”
 / 

无需鼓样本库,只需描述“低音很重的 808 踢鼓”或“紧致的军鼓声”,API 就会给出 4 个版本试听。我们把它们映射到 A、S、D 键,现场演示演奏。

如果想进一步挑战模型,还可以用它生成角色语音片段。只需指定角色,再把台词放在括号里。

  • 嗨翻 DJ: 嗨翻 DJ 说:“Lets get the party started”
 / 
  • 兽人任务中: 粗犷兽人说:“This room is over capacity”
 / 
  • 海妖之歌: 空灵女声唱:“Time to go home to bed, party is over”
 / 

自定义预设

可以保存并命名自己的预设,比如“直播特效”,包含惊呼、笑声、掌声等。搭建好音效板后,点击 分享,即可复制链接或直接分享到社交平台。任何人通过链接都能加载你的 SB1 配置,播放你精选的声音。

开发者要点

  • 无状态生成:每次 API 调用都是独立的,无需管理训练流程或存储大量样本库,只需在界面缓存用到的链接即可。
  • 低延迟:通常生成时间不到 2 秒,实际体验几乎是即时的。
  • 高扩展性:可并行批量生成上百个声音,再存入自有 CDN,应对高并发场景。
  • 多格式支持:需要高保真可用 WAV,文件小可选 MP3。

想自己试试,查看我们的文档。文档中有 JavaScript、Python、cURL 等代码示例,教你如何集成 SFX API 到项目中。

接下来会怎样?

SB1 只是我们音效模型的一个演示。我们正在开发 OBS 和数字音频工作站插件,让你无需离开直播或制作软件就能生成新声音。同时也在优化模型,提升音乐相关提示词的表现,比如异域打击乐或合成器音色。

如果你做了有趣的项目,欢迎分享给我们。可以在社交平台 @我们,或直接分享预设链接。无论你是主播、播客、游戏开发者,还是喜欢玩声音的用户,SB1 和 SFX API 都能让你随时释放音频创意。

立即免费试用 ——无需音效库。

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作