
Kindred 携手 ElevenLabs 让经典角色焕发新生
- 分类
- ElevenAPI 案例
- 日期
用语音优先的 AI 拓展访问和提升效率
尘埃作为面向 AI 原生企业的操作系统,Dust 现已支持多语言语音输入和输出,由 ElevenLabs 提供技术支持。Dust 专为将模型融入日常工作而设计,需要能跨语言、设备和场景,低延迟、高还原度的语音能力。
这不是尝试性的功能。多次收到客户需求后,语音成为产品重点。最终实现了通勤时免手操作智能体、多语言全球团队协作,以及适用于异步流程的专业音频输出。
Dust 总结了工作场景下语音的四项关键需求:
评估了 OpenAI、Google、Deepgram、AssemblyAI 等服务后,Dust 选择了 ElevenLabs,因其音质更优、部署更快:
Dust 在两大核心流程中实现了语音支持:
通过 ElevenLabs 的 scribe_v1 模型,用户可用麦克风与智能体对话。系统自动识别语音语言、转写内容,并智能分发请求,甚至能从自然语音中识别智能体名称。
语音输入已支持移动端,适合不便打字的场景。
通过 Speech Generator,Dust 智能体可用 ElevenLabs 的 eleven_multilingual_v2 和 eleven_v3 模型生成音频内容。输出包括播客、简报、叙述类音频,适用于内部使用和外部分享。
Sound Studio 基于 文本音效生成,为训练和内容场景增加非语言音频层。
Dust 正在探索实时对话式语音智能体、更深入的音频理解(超越转写),以及支持会议、演讲等长文本输入。通过集成 ElevenLabs,Dust 让语音无缝融入企业 AI。



