
全新 Eleven Turbo v2.5 上线
- 分类
- 研究
- 日期
Scribe v2 专为大批量转录、字幕和字幕制作而设计。相比 Scribe v1,稳定性和准确性进一步提升,更好地处理长音频、停顿、语调变化和长时间静音。

Scribe v2 Realtime 针对超低延迟和智能体场景优化,而 Scribe v2 更适合长时复杂录音,能在多说话人、不同口音和表达风格下保持高准确率,适应各种真实音频环境,始终输出可靠转录结果。
Scribe v2 在行业标准测试中实现了最低词错误率。

关键词提示不仅仅是自定义词汇,还能结合转录内容上下文。可选择最多 100 个词或短语,Scribe v2 会智能判断何时转录这些术语,特别适合技术领域、品牌名称和行业专用语言。

Scribe v2 原生支持实体检测,便于结构化音频分析。
可选择多达 56 个类别,涵盖个人身份信息、健康数据或支付信息。Scribe v2 会自动检测这些内容及其在转录中的精确时间点,便于大规模审核、脱敏或处理敏感信息。
详细信息请参见 API 文档:https://elevenlabs.io/docs/developers/guides/cookbooks/speech-to-text/batch/entity-detection
Scribe v2 原生支持智能多语言 workflow。
可上传包含多种语言的音频文件,模型会自动识别每种语言并准确转录,无需手动分段或配置。
Scribe v2 提供多项专为企业和开发者设计的功能:
Scribe v2 现已应用于 ElevenLabs Studio,带来更精准的字幕、转录,助力团队高效管理营销、媒体、研究、培训、合规等场景下的大量音视频内容。

立即试用:https://elevenlabs.io/app/studio
借助 Scribe v2,开发者和企业可自动化复杂音频流程,提升全球内容 workflow 的准确率,并通过合规和数据本地化控制实现安全扩展。

Scribe v2 现已通过我们的 API 和 Creative 平台上线。
立即试用:https://elevenlabs.io/app/speech-to-text