跳到内容

网络研讨会回顾:让文本聊天机器人拥有自然人声

发布时间

收听收听本文

聊天智能体已成为企业软件的标配。大多数公司都有,或正在开发。但很少有人考虑到,当用户更想直接说话时会发生什么。

Nana 是沙特阿拉伯最大的超级应用之一,选择了不同的路径。在幕后揭秘:Nana 如何用智能体提升客户体验中,Nana 客户体验负责人 Karim Mustafa 分享了公司如何在支持体系中全面部署智能体,以及团队、成本和质量评分随之发生的变化。

现在,大多数团队关心的不是要不要加语音,而是如何在不推倒重来的情况下实现。

为什么语音集成比想象中更难


Nana 于 2016 年在沙特阿拉伯率先推出生鲜配送。十年间,公司发展为涵盖洗衣、洗车、外卖等多项服务的超级应用。产品线扩展后,客户咨询量也大幅增加。团队需要 54 名支持人员轮班,才能满足需求。

转折点在于 Nana 从 FAQ 机器人和基础聊天流程,升级到基于 ElevenLabs 的前端智能体。该智能体直接在 Nana 应用内与客户对话,能解决问题、解答疑问、跟踪订单,并在需要时升级处理。服务质量立竿见影且始终如一。

业务影响非常明显:

  1. Nana 客户支持成本降低了 85%
  2. 响应时间缩短到几秒

技术上可用,但对话体验很差。

上下文也是难题之一。每轮都把对话历史传给 LLM 是必要但不够的。相同的话语,不同语气表达,含义完全不同——比如“我没事”带着释然和带着不满,文字一样,交流却不同。忽略语音维度的系统,无论模型多强,听起来总会有些不自然。

还有工程维护成本。如果团队自己负责语音编排,就要持续维护轮流说话逻辑、中断处理和延迟分析。这不是一次性工作。

语音 AI 能解决这些问题:每次都能统一处理结果,实时适应新信息,按需横向扩展应对任何通话量。

如何为现有智能体添加语音

最简洁的方式是采用双 WebSocket 架构。

Karim 介绍了团队思维的转变。遇到新运营挑战时,大家不再首先考虑需要多少人,而是能多快搭建一个智能体来解决。

剩余支持团队成员可选择固定班次或与 AI 相关 KPI 挂钩的弹性工时。所有人都选择了弹性模式。

Urban Company 目前在三大场景中应用语音 AI:

  1. 多模态支持。Nana 发现客户不仅想打电话,也希望能打字。根据客户习惯匹配渠道,能更快推动使用和取得效果。
  2. 关注提示词质量,而不仅仅是技术。AI 的表现取决于你的指令。Karim 的团队花时间编写提示词,教会智能体如何表达同理心、用符合品牌风格的方式回复。
  3. 阿拉伯语部署时要用 tashkeel。在提示词中为阿拉伯语文本添加元音符号,可大幅提升发音准确性和自然度。
  4. 让人工向上游转型,而不是被替代。剩余团队最有价值的工作是优化 AI,而不是被 AI 取代。让他们参与工作流设计和质量审核。
  5. 从一开始就为规模化设计。首个智能体上线后,同一平台可支持外呼、内部流程、广告和跨部门场景。现在 Nana 已成为其他团队快速落地新项目时的参考对象。
  6. 直接对接源头。Nana 评估的多家厂商其实是在加价转售 ElevenLabs。直接用 ElevenLabs,Nana 能获得最新模型、更低成本和工程支持。

还有

Instahelp请点击这里。

nana

相关内容

用高质量 AI 音频创作