
ElevenCreative Flows 推出实时协作功能
- 分类
- 产品
- 日期

Scribe v2 Realtime 可在 150 毫秒内精准捕捉实时语音,适用于智能体、会议和需要即时理解的 AI 智能体场景。
Scribe v2 Realtime 以低于 150 毫秒的延迟实现行业领先的准确率,树立实时语音识别新标杆。
自动检测语音起止,精准分段,提升实时处理流畅度。
在不同口音、方言和录音环境下都能保持高准确率。
通过 API 将 Scribe Realtime v2 集成到产品中,支持全流式转写和提交控制。



支持上传任意格式的音频或视频(如 MP4、MOV、MP3、WAV 等),Scribe v2 自动将语音精准转为文本,适用于字幕、双语字幕或编辑。
Scribe v2 实现行业领先的转写准确率,即使在复杂音频环境或多样口音下,也能输出干净、可编辑的文本。
可选择最多 1000 个特定词语或句子,Scribe 将根据上下文准确转写。
从笑声到脚步声,Scribe v2 能为每个声音事件打标签,让转写内容更完整。
Scribe v2 可智能区分并标记每位说话人,计算实体时间戳,并自动从转录文本中去除敏感信息。

AI 语音转文本支持 90 多种语言,选择语言并上传音频文件即可。


