Scribe v2 全新发布

收听收听本文

0:00

0:000:00

Scribe v2 专为大批量转录、字幕和字幕制作而设计。相比 Scribe v1，稳定性和准确性进一步提升，更好地处理长音频、停顿、语调变化和长时间静音。

Scribe v2 Realtime 针对超低延迟和

Scribe v2 在行业标准测试中实现了最低词错误率。

关键词提示，支持上下文感知转录

关键词提示不仅仅是自定义词汇，还能结合转录内容上下文。可选择最多 100 个词或短语，Scribe v2 会智能判断何时转录这些术语，特别适合技术领域、品牌名称和行业专用语言。

Scribe v2 原生支持实体检测，便于结构化音频分析。

可选择多达 56 个类别，涵盖个人身份信息、健康数据或支付信息。Scribe v2 会自动检测这些内容及其在转录中的精确时间点，便于大规模审核、脱敏或处理敏感信息。

Scribe v2 原生支持智能多语言 workflow。

可上传包含多种语言的音频文件，模型会自动识别每种语言并准确转录，无需手动分段或配置。

Scribe v2 提供多项专为企业和开发者设计的功能：

Scribe v2 现已应用于 ElevenLabs Studio，带来更精准的字幕、转录，助力团队高效管理营销、媒体、研究、培训、合规等场景下的大量音视频内容。

借助 Scribe v2，开发者和企业可自动化复杂音频流程，提升全球内容 workflow 的准确率，并通过合规和数据本地化控制实现安全扩展。

Scribe v2 现已通过我们的 API 和 Creative 平台上线。