网络研讨会回顾:让文本聊天机器人拥有自然人声
- 发布时间
收听收听本文
聊天智能体已成为企业软件的标配。大多数公司都有,或正在开发。但很少有人考虑到,当用户更想直接说话时会发生什么。
Nana 是沙特阿拉伯最大的超级应用之一,选择了不同的路径。在幕后揭秘:Nana 如何用智能体提升客户体验中,Nana 客户体验负责人 Karim Mustafa 分享了公司如何在支持体系中全面部署智能体,以及团队、成本和质量评分随之发生的变化。
现在,大多数团队关心的不是要不要加语音,而是如何在不推倒重来的情况下实现。
在
为什么语音集成比想象中更难
Nana 于 2016 年在沙特阿拉伯率先推出生鲜配送。十年间,公司发展为涵盖洗衣、洗车、外卖等多项服务的超级应用。产品线扩展后,客户咨询量也大幅增加。团队需要 54 名支持人员轮班,才能满足需求。
转折点在于 Nana 从 FAQ 机器人和基础聊天流程,升级到基于 ElevenLabs 的前端智能体。该智能体直接在 Nana 应用内与客户对话,能解决问题、解答疑问、跟踪订单,并在需要时升级处理。服务质量立竿见影且始终如一。
业务影响非常明显:
- Nana 客户支持成本降低了 85%
- 响应时间缩短到几秒
技术上可用,但对话体验很差。
上下文也是难题之一。每轮都把对话历史传给 LLM 是必要但不够的。相同的话语,不同语气表达,含义完全不同——比如“我没事”带着释然和带着不满,文字一样,交流却不同。忽略语音维度的系统,无论模型多强,听起来总会有些不自然。
还有工程维护成本。如果团队自己负责语音编排,就要持续维护轮流说话逻辑、中断处理和延迟分析。这不是一次性工作。
语音 AI 能解决这些问题:每次都能统一处理结果,实时适应新信息,按需横向扩展应对任何通话量。
如何为现有智能体添加语音
最简洁的方式是采用双 WebSocket 架构。
Karim 介绍了团队思维的转变。遇到新运营挑战时,大家不再首先考虑需要多少人,而是能多快搭建一个智能体来解决。
剩余支持团队成员可选择固定班次或与 AI 相关 KPI 挂钩的弹性工时。所有人都选择了弹性模式。
Urban Company 目前在三大场景中应用语音 AI:
- 多模态支持。Nana 发现客户不仅想打电话,也希望能打字。根据客户习惯匹配渠道,能更快推动使用和取得效果。
- 关注提示词质量,而不仅仅是技术。AI 的表现取决于你的指令。Karim 的团队花时间编写提示词,教会智能体如何表达同理心、用符合品牌风格的方式回复。
- 阿拉伯语部署时要用 tashkeel。在提示词中为阿拉伯语文本添加元音符号,可大幅提升发音准确性和自然度。
- 让人工向上游转型,而不是被替代。剩余团队最有价值的工作是优化 AI,而不是被 AI 取代。让他们参与工作流设计和质量审核。
- 从一开始就为规模化设计。首个智能体上线后,同一平台可支持外呼、内部流程、广告和跨部门场景。现在 Nana 已成为其他团队快速落地新项目时的参考对象。
- 直接对接源头。Nana 评估的多家厂商其实是在加价转售 ElevenLabs。直接用 ElevenLabs,Nana 能获得最新模型、更低成本和工程支持。
还有
Instahelp请点击这里。
.webp&w=3840&q=95)
.jpg&w=3840&q=80)


