%20(1).webp&w=3840&q=80)
ElevenLabs 荣获 2026 年 Google Cloud 年度合作伙伴
- 分类
- 公司
- 日期
超快、超准,专为实时语音打造。Scribe v2 Realtime 为智能体、会议和对话式 AI 提供即时转写。
基于全球多样化数据训练,并针对自然语音精调,Scribe 在主流语言和口音下实现行业领先的词错误率。
音频流式传输,约 150 毫秒内返回转写结果,助力智能体、会议和对话式 AI 实时理解。

Scribe v2 Realtime 专为开发者打造,适用于对速度和准确率要求极高的对话式智能体、会议助手和语音应用。
Scribe v2 Realtime 在 90 种语言中都能保持高准确率,轻松应对各种口音、方言和声学环境。
支持 PCM(8–48 kHz)和 μ-law 编码,兼容电话、浏览器和录音棚场景。
自动检测语音起止,精准分段音频,实现流畅高效的实时转写。
开发者可自定义何时提交转写结果,适合自定义流式场景和精细化准确率需求。





基于 Scribe v1 打造,Scribe v2 Realtime 实现约 150 毫秒延迟,在不同口音、语调和环境下都能保持突破性准确率。
Scribe v2 Realtime 采用预测式转写,提前判断下一个最可能的词和标点,实现实时高准确率。
内置复杂词汇支持,包括技术术语、药品名称和专有名词。
音频可持续分段发送,实时返回转写结果,无需缓冲,真正实现实时理解。
即使连接重置,Scribe v2 Realtime 也能无缝继续转写。

Natural Speech
Filler words, pauses and emotional cues

Low-quality Audio
Background noise or low-bandwidth audio

Accents
Diverse accents and pronunciations

Domain Terms
Acronyms, brands, financial or medical terms
