
ElevenLabs 现已成为 Kiro Power
- 分类
- ElevenAPI
- 日期
Scribe v2 Realtime 在约 150 毫秒延迟下实现行业领先的转写准确率,即使在复杂音频或多样口音下也表现出色。
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
可在嘈杂环境、背景音乐、强烈口音和低质量音频下稳定转写。
基于 Scribe v1 打造,Scribe v2 Realtime 实现约 150 毫秒延迟,在各种口音、语调和环境下都能保持高准确率。

Scribe v2 Realtime 专为开发者打造,适用于对话式智能体、会议助手和对速度与准确率要求极高的语音应用。
Scribe v2 Realtime 采用预测式转写,提前判断下一个最可能的词和标点,实现实时高准确率。
自动检测语音起止,精准分割音频,实现流畅高效的实时转写。
开发者可自定义转写提交时机,适合自定义流式处理和精细化控制。
支持 PCM(8–48 kHz)和 μ-law 编码,兼容电话、浏览器和录音棚等多种场景。
Scribe v2 适用于批量场景,Scribe v2 Realtime 适用于低延迟需求
在不同口音、方言和录音条件下都能保持极高准确率。
更改 languageCode 预览不同语言
import { useScribe } from "@elevenlabs/react";
const scribe = useScribe({
modelId: "scribe_v2_realtime",
languageCode: , // 设置语言
onSessionStarted: () =>
console.log("Session started"),
onPartialTranscript: (data) =>
console.log("Partial:", data.text)
});“从本地语言配音 Reels,到在 Horizon 生成音乐和角色声音,ElevenLabs 平台让全球创作者、企业和机构都能大规模使用语音、音乐和音效。”
“Scribe 在多语言下的高准确率让 Fieldy 能理解每一次日常对话,轻松扩展到全球。迁移到 ElevenLabs Scribe 后,Fieldy 用户留存率提升了 50%。”
“ElevenLabs 让我们能快速为 SDK 集成强大的文本转语音功能,智能体可实时用富有表现力的语音回应用户问题或反馈所见内容。”

“Twilio 已将 ElevenLabs 的生成式 AI 语音技术集成到其 CPaaS,提升了 ConversationRelay。该集成让企业和开发者可直接在 Twilio CPaaS 平台创建拟人、富有表现力、实时响应的对话式 AI 语音交互。ElevenLabs 很高兴能为 ConversationRelay 提供最具表现力、最自然的人声。”









.webp&w=3840&q=80)
