
ElevenLabs 现已成为 Kiro Power
- 分类
- ElevenAPI
- 日期
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
Scribe v2 实现行业领先的转录准确率,即使在复杂音频环境或多样口音下,也能输出干净、可编辑的文本。
Uh, hi! So, um, I was wondering if you wanted to meet up for coffee? Maybe tomorrow morning? [nervous laugh] Totally fine if not!
在嘈杂环境、背景音乐、强烈口音和低质量音频下也能准确转录。
ElevenLabs 转录 API 可识别笑声、情感和音效。通过关键词提示,支持领域专属词汇转录。
.webp&w=3840&q=95)
.webp&w=3840&q=95)

可捕捉笑声、掌声、音乐、背景噪音等非语音事件。转录稿完整还原音频上下文,不仅仅是文字内容。
自动识别并标记最多 48 位说话人,清晰区分发言人,转录稿结构清晰易读。
自动识别并标记 56 种实体类型,包括姓名、日期、地点和组织等。
在不同口音、方言和录音条件下都能保持高准确率。
更改 languageCode 预览不同语言
import { ElevenLabsClient } from "@elevenlabs/elevenlabs-js";
const elevenlabs = new ElevenLabsClient({
apiKey: "<your_api_key>"
});
const response = await fetch(
"https://storage.googleapis.com/eleven-public-cdn/audio/marketing/nicole.mp3"
);
const audioBlob = new Blob([await response.arrayBuffer()], { type: "audio/mp3" });
const transcription = await elevenlabs
.speechToText.convert({
file: audioBlob,
modelId: "scribe_v2",
tagAudioEvents: true,
languageCode: , // 设置语言
diarize: true
});
console.log(transcription);“从本地语言配音 Reels,到在 Horizon 生成音乐和角色声音,ElevenLabs 平台让全球创作者、企业和机构都能大规模使用语音、音乐和音效。”
“Scribe 在多语言环境下的高准确率,让 Fieldy 能理解每一次日常对话,轻松扩展到全球。迁移到 ElevenLabs Scribe 后,Fieldy 用户留存率提升了 50%。”
“ElevenLabs 让我们能快速为 SDK 集成强大的文本转语音功能,智能体可实时用富有表现力的语音回应用户问题或反馈所见内容。”

“Twilio 已将 ElevenLabs 的生成式 AI 语音技术集成到其 CPaaS,增强了 ConversationRelay。该集成让企业和开发者可直接在 Twilio CPaaS 平台创建拟人、富有表现力、实时响应的对话式 AI 语音交互。ElevenLabs 很高兴能为 ConversationRelay 提供最具表现力、最自然的语音。”








.webp&w=3840&q=80)
