一站式强大编辑器,集成顶级 AI 音频模型
专为视频创作者、播客和有声书作者打造,用富有表现力的 AI 旁白、音乐、音效和真实录音,让故事更生动。



视频
音频
全新 Studio 3.0
用 Studio 3.0 打造沉浸式体验,适用于播客、有声书和视频。AI 语音、音乐、字幕一站式编辑,提升内容表现力。
文本转语音
Eleven Music
AI 音效
字幕
变声器
转录
人声分离
Studio Agent
视频支持
添加新旁白
用自然流畅的旁白让脚本生动起来。可选 10,000 多种音色,涵盖真实口音、角色音或专业解说,录音内容可直接通过文本编辑修改。

用 Eleven Music 生成专属背景音乐
为内容定制专属音乐。可生成任意风格配乐,或让 Studio 自动为视频配乐,匹配场景氛围。

添加自定义音效
用提示词描述即可生成任意音效。从环境氛围到电影级冲击音效,直接在 Studio 添加,提升成品质感。

用语音纠错秒修错误
用 AI 语音克隆即时编辑语音音频。只需修改脚本,Studio 即可重生成同一声音,无需重录或多次录制。

用人声分离清理杂音
用 AI 降噪去除背景杂音、混响和干扰,提升音频质量,让对白始终清晰专业。


Studio Agent:AI 协作编辑助手
描述创意,Studio Agent 即刻实现。自动生成脚本、选择音色、添加音效、整理片段。可随时与智能体协作或手动调整。
所有创作工具,一条时间线上无缝操作
从字幕、协作到视频剪辑、多语种音频,Studio 3.0 集合所有编辑、制作、分享所需工具,助力高效创作。
时间线
精准剪辑、合并音频和视频。旁白、音乐、音效一站式同步,操作直观。

视频支持
上传 MP4 或 MOV 文件,AI 智能增强。添加旁白、背景音乐、音效和自动字幕,轻松在线编辑视频。

字幕
一键生成字幕,提升可访问性和互动性。自定义样式,添加多语种字幕,字幕与音频或视频自动同步。

项目公开链接
分享可编辑链接,便于客户或团队反馈。时间轴直接收集评论,高效协作。

支持 32+ 种语言
支持 30 多种语言音视频制作,表达丰富,旁白本地化,贴合受众需求。

为每位创作者打造
无论视频创作者、播客还是有声书作者,Studio 3.0 灵活适配各类流程,融合 AI 音频编辑、视频剪辑与专业音效设计。

Video creators
AI 在线视频编辑。旁白与画面同步,自动生成字幕,添加背景音乐和音效,让故事更生动。

Audiobook authors
文本编辑即刻修改旁白,自定义音效丰富音频,生成电影级有声书预告。

Podcasters
一键降噪清理对话,无需重录即可修正错误,为每集定制主题音乐或音效。

AI filmmakers
视频、音频与 AI 生成音乐自由组合,快速搭建场景,添加旁白,探索声音设计,全部在同一编辑器内完成。
Studio 全部功能,API 随时调用
通过 API,批量调用 Studio 3.0 的音色、音乐和音频工具,适配任意工作流程。
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
const client = new ElevenLabsClient({ apiKey: "YOUR_API_KEY" })
await client.textToSpeech.convert("JBFqnCBsd6RMkjVDRZzb", {
outputFormat: "mp3_44100_128",
text: "The first move is what sets everything in motion.",
modelId: "eleven_multilingual_v2",
});
常见问题
Studio 是我们的一站式工作流,适用于有声书、播客和解说视频制作。可管理长篇项目、分配说话人、音视频对齐、添加音乐和音效,并支持字幕发布。
支持。Studio 支持 32 种语言,能识别混合语言文本。可生成视频转录和多语种字幕,并导出字幕文件。
支持。可为选定文本片段或章节分配不同音色,让每个角色或讲述者拥有独特声音。
Studio 支持 EPUB、PDF、TXT、HTML、MP4、MOV、MP3、WAV、FLAC,也可通过 URL 初始化项目。
Studio 可与声音库、声音设计、专业语音克隆、多语种模型和 Eleven Music 集成,打造完整制作流程。
导入 MP4 或 MOV,使用时间线编辑器剪辑、合并和编辑视频。音视频对齐,添加音乐和音效,导出成品文件。
支持。可录制或生成旁白,添加到视频并在时间线上同步,也可通过编辑文本修改解说内容。
用 Eleven Music 生成配乐或导入音轨。为视频添加背景音乐,调整音量,循环环境音效,打造无缝音频氛围。
支持。上传音频或视频,自动生成精准转录。通过编辑文本修改语音,并导出转录或字幕。
用人声分离减少背景噪音和混响,清理播客、旁白和现场录音对白。
支持。用视频合并工具拼接片段,并在时间线上精准同步音视频。
支持编辑 MP3、WAV 等格式。可剪辑、调整、重生成语句,并应用变声器或人声分离,输出干净一致的音频。
