支持哪些音频格式转录？

支持 MP3、WAV、M4A、AAC、FLAC 等主流音频格式。可直接从设备或云存储上传，无需转换。

转录速度有多快？

AI 可在几秒内处理音频文件，长录音也不例外。Scribe 带来高准确率、带说话人标签的转写结果，速度极快。

生成后可以编辑转录文本吗？

每份转写都可在专属编辑器中优化：点击单词修正、调整片段起止、纠正说话人标签。每个单词自带时间戳，编辑始终与音频同步，导出文件完整保留所有更改。

这些转录文本相比其他工具有哪些优势？

Scribe 生成结构化 AI 转写。每份转写最多可标记 32 位说话人、每个单词带时间戳，笑声、掌声等非语音事件也会标记，覆盖 90 多种语言。结构化文本便于搜索和引用：可直接跳转到某句话的准确时间，并清楚是谁说的。

有哪些导出选项？

支持七种格式：TXT、DOCX、PDF、JSON、SRT、VTT、HTML。做笔记或写文章选 TXT 或 DOCX，配视频字幕用 SRT 或 VTT，开发者需要时间数据时用 JSON。所有导出都保留说话人标签和时间戳。

用 AI 将音频转为文本

ElevenLabs 可将访谈、讲座和语音备忘录转为准确、带说话人标签的文本，即使有背景噪音、重口音或长时间录音也能轻松处理。支持 90 多种语言，立即体验。

访谈音频质量差也能清晰转写

播客说话人全部标记，随时可编辑

讲座小时级音频，几分钟转写完成

歌词混音环境下也不错过任何词

通话重口音也能准确识别

访谈.pdf

不仅仅是转录，更懂音频

ElevenLabs 音频转文本可识别说话人、说话时间及周围环境，始终输出结构化、可用的转录文本。

顶级准确率

Scribe 在基准测试中表现优于所有主流 ASR 模型。即使是远距离麦克风、重口音或低质量电话录音，也能保持行业领先的词错误率。

编辑转录文本

点击单词即可修改，分割或合并片段，重新分配说话人标签，无需离开页面。每个单词都带有时间轴，所有编辑都与音频同步。

Amidst the outer atmosphere of the planet Aurora, the sky shimmered with fractured light, as though the planet's veil were made of stained glass suspended in space.

Sensors pulsed with irregular patterns, the kind no algorithm could quite reconcile.

Amidst the outer atmosphere of the planet Aurora, the sky shimmered with fractured light, as though the planet's veil were made of stained glass suspended in space.

90 多种语言和口音

Scribe 支持 90 多种语言转写，包括许多小语种。还能自动识别语言，精准实现音频转文本。即使访谈中切换语言，也能输出连贯的转写结果。

Japanese

Hindi

Polish

Swedish

Mandarin

Vietnamese

French

多种格式支持

支持上传 MP3、WAV、M4A、FLAC、OGG 及视频文件，结果可导出为 TXT、DOCX、PDF、SRT、VTT、JSON 或 HTML。一个工具即可覆盖所有录音设备。

音频事件标记

Scribe 会标记笑声、掌声等非语音事件，让讲座转写清晰显示现场反应的时间点。

说话人时间戳

Scribe 最多可标记 32 位说话人，并为每个单词加上时间戳，方便在小组或圆桌访谈中准确区分每个人的发言时间。

三步轻松实现音频转文本

上传音频

可直接从设备或云存储拖入文件。支持 MP3、WAV、M4A、AAC、FLAC、OGG 及主流视频格式，无需提前转换。

Scribe 自动处理

Scribe 能识别每位说话人、为每个单词加时间戳，即使有重叠对话或环境噪音也能保持准确。超过 8 分钟的录音会自动分段并并行处理，长录音也能快速完成。

下载结构化文本

转写结果自带说话人标签和音频事件标记，点击单词即可修改，支持多种导出格式，满足不同工作需求。

已转录数百万词，持续增长中

“我主要用 ElevenLabs 转录语音消息，准确率非常突出。即使说话人是刚学会阅读的小学生，也能精准分析学生的朗读流利度，这对了解每个学生的进步非常关键。”
Pedro A.
技术负责人
“非常适合访谈转录，准备演讲时语音质量也很棒。”
Izabela M.
客户体验研究员
“ElevenLabs Scribe v2 模型推理速度极快，转录几乎实时，比我们用过的其他模型快很多。”
Vedaswaroop I.
创始人