跳到内容

企业级可用的对话式 AI:Scale AI 工程负责人 Felix Su 专访

通过智能架构和防护措施打造可控的 AI 体验

Scale logo on a purple background.

成功的企业级 AI 不只是拥有最新技术,更关键在于在 AI 基础能力之上构建合适的架构和控制机制。现成的 LLM 功能强大,但缺乏对业务逻辑、品牌规范和安全原则的深入理解。要实现定制化体验,必须精心设计和测试由提示词、LLM、防护措施、工具等模块组成的系统,引导生成式 AI 遵循企业规则。

分层架构的优势:为什么架构很重要

在构建 对话式语音 AI 时,开发者可以选择使用多模态语音转语音模型,或将 ASR(转写)、LLM 和 TTS 等组件组合起来。对于有特定需求的企业来说,后者往往更实用。

“在企业场景下,AI 往往不能只靠 LLM 实现。”Scale GenAI 平台工程负责人 Felix Su 解释道,“复杂系统需要设计来遵循业务逻辑、维护品牌形象,并在严格防护下运行。这些行为对每个企业都是定制的,因此在 LLM 之上实现这些系统更为实际,而不是完全依赖其内在行为。虽然多模态能力已直接集成到模型中,但这些模型在关键生产场景的应用速度低于预期,原因在于生成过程与输入输出之间缺乏控制。以 TIME AI 为例,结合 STT 和 TTS,我们既能控制文本 LLM 的输入,也能通过定制防护措施把控系统输出。这种方式通常比直接用多模态 LLM 更实用。”

在打造 TIME AI 体验时,Scale 将 TIME 的文章内容索引为知识库,便于随时检索,将业务逻辑编码为一系列系统提示词,并通过防护措施防止 GenAI 出现幻觉或违反安全、品牌规范。在此基础上,结合 ElevenLabs 对话式 AI 协作平台的语音,让体验更加生动。

TIME 年度人物体验:语音让互动更出色

TIME AI 的上线让读者可以就 TIME 的新闻报道,包括标志性的年度人物内容,自然对话。区别于众多聊天机器人,这一实现的亮点不仅在于知识,更在于语音。

“加入语音后,整体体验更有冲击力。”Su 回忆道,“没有语音的话,很容易和其他聊天机器人混淆。我们希望智能体像实时阅读伙伴一样,能深入自由对话。”该方案结合了 Scale AI 在 AI 开发上的专业能力和 ElevenLabs 对话式 AI 平台,让体验既贴近真人,又能严格把控内容和品牌语音。

打造企业级系统

企业如需大规模部署对话式 AI,与 Scale AI 和 ElevenLabs 合作是经过验证的选择。Scale AI 擅长构建安全可控的多模态 AI 系统,具备完善的防护措施,ElevenLabs 则提供业内领先的语音技术,可无缝集成到这些系统中。

TIME 的应用聚焦新闻领域,但同样的架构也适用于各类企业场景,尤其是客户服务和支持。用户对基础聊天机器人已感到厌倦,更期待更具互动性、更拟人的体验。

感谢 Felix 对本文的贡献。你可以在 LinkedIn & X 上找到 Felix Su,也可以在 TIME 的 2024 年度人物 页面,以及往年年度人物页面体验他与 TIME 共同打造的对话式 AI 语音体验2021, 20222023.

开发者可通过 我们的文档 快速上手对话式 AI,企业如需在生产环境部署可信赖的对话式 语音智能体 解决方案,可联系企业解决方案团队,详情见 ElevenLabs扩展.

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作