跳到内容

网络研讨会回顾:德克萨斯州米德兰如何打造 24/7 多语种市民服务助手

德克萨斯州米德兰如何打造 24/7 多语种市民服务助手

webinar-recap

Cars24正在大规模运行生产级语音智能体,覆盖 13 种语言。

本文回顾了 Behind the Agent:Cars24 如何用 Voice AI 自动化超 300 万分钟销售通话 ,由 Cars24 AI 与创新负责人 Jayesh Gupta 讲解,详细介绍了 Cars24 如何从最初的简单场景,到多智能体架构,逐步搭建并部署语音 AI 系统,支持数百万分钟的客户对话。

大规模语音 AI 的意义

Cars24 是印度最大的二手车平台之一,业务遍及印度、阿联酋和澳大利亚。每月售出 4,000 - 4,500 辆汽车,完成 100,000+ 次检测,促成 22,000+ 次试驾。

他们面临的挑战并不独特。

市民并不总是知道该找哪个部门,Jackie 不需要他们知道。她会自动分流,能解答的直接答复,确实需要人工时再转接。

演示 1:Jackie 处理账单问题并转接

等待时间越来越长,30 天流程中容易漏掉跟进。

从线索筛选到贷款资料管理,整个流程成本高、难以扩展。

演示 2:Jackie 处理多话题提问

  1. 25% 通话量已自动化
  2. 近一半销售由 Voice AI 协助完成
  3. 通话成本降低 50%

演示 1:Cars24 议价智能体

意义:真实对话往往不会只围绕一个话题。市民常常会有第二个问题。Jackie 能自然应对话题切换,因为她不是在照本宣科,而是基于知识库,针对实际提问做出回应。

演示内容:

观看完整回放

观看完整回放

- 对话自然流畅,延迟低,无机械感停顿

- 智能体在通话中促成车主承诺选择 Cars24

意义:这些智能体能主动销售、处理不确定性、应对异议并推动成交——而且用客户最熟悉的语言。Cars24 发现,语言匹配能直接提升通话时长和业务转化。

演示 2:多智能体协作实现交叉销售

场景: 客户错过检测预约。筛选智能体致电重新预约,识别到升级意向后,实时转接给销售智能体,后者无缝衔接对话,继续推进。

演示内容:

- 智能体 1(Sneha)首先说明错过预约并重新安排

- Sneha 询问意图:车主是升级还是因财务原因出售?

- 客户表达升级意向

- Sneha 主动提出转接至合适团队,并在通话中完成转接

- 智能体 2 获取全部上下文,继续推进二手车购买对话

- 客户要求一小时后回电时,智能体确认并总结预约状态,顺利结束通话

意义:该演示展示了多智能体协作的实际效果。每个智能体专注一项任务,信息顺畅传递,无重复、无遗漏。Cars24 正在打造一个 24/7 电话入口,客户可全程自助完成卖车、买车、金融等流程,无需重复说明。

Cars24 技术实现方式

Cars24 从最简单的场景入手:错过预约提醒。通话短、结果明确、出错成本低,便于先验证效果再扩展。

升级到更长、更复杂的呼入通话(如平均 7 分钟、最长 13 分钟的购车咨询)时,单智能体架构遇到瓶颈。

Mini 模型在 3 到 4 分钟后容易丢失上下文。

更大模型则带来延迟。

所有内容塞进一个提示词会让系统脆弱:贷款流程变动可能影响购车流程。

他们的解决方案是多智能体协作,将对话拆分为多个阶段:

  1. 小型筛选智能体用 mini 模型捕捉初步意图
  2. 客户有意愿并愿意稍等后,由更大模型负责深入咨询
  3. 如涉及价格或金融问题,则由第三个专注贷款的智能体介入

每个智能体各司其职,互不影响,修改其中一个不会影响其他部分。

最终技术栈(通过 ElevenAgents 平台协作):

  1. 语音转文本:ElevenLabs Scribe v2 实时转写,适用于 13 种语言的嘈杂二三线环境,准确率高
  2. 文本转语音:ElevenLabs Flash 2.5,近期升级至 V3 富表现模式,销售转化率明显提升
  3. LLM:大多数场景用 GPT-4.1 mini,复杂咨询用 GPT-4o 或同级模型,支持更深层推理
  4. 电话系统:WebSockets + 24 kHz PCM,保证音质;印度地区供应商包括 Twilio、Exotel、Plivo
  5. 集成:自定义 API 调用 ElevenLabs Agents 平台,支持 MCP,并为澳大利亚市场原生集成 HubSpot
  6. 向量数据库:Qdrant,采用二进制量化,支持超百万向量大数据集,降低延迟和成本

选择 ElevenLabs Agents 而非单独组装 STT、LLM、TTS 组件,核心原因是延迟。

即使用同样底层模型,自建流程延迟始终超过 1 秒。

Cars24 的最佳实践

Cars24 实践经验总结

1. 从出错成本最低的场景切入。Cars24 首个场景是错过预约提醒——通话短、简单、风险低。先在这里验证模型,建立内部信任,为后续高价值环节积累经验。

2. 用真实客户测试,不要只做模拟。内部测试无法还原真实对话的复杂性。Cars24 直接在 10% 实际流量上试点,接受短期波动,用真实反馈持续优化。

3. 严格限制提示词长度。 Cars24 通话时长 2 分钟以内,提示词上限 4,000-5,000 token。更长会拖慢模型,且效果不稳定。如需更多内容,建议拆分为多个智能体。

4. 常见问题答案直接写进提示词,不放知识库。客户最常问的问题,答案直接写在提示词里。工具调用和 RAG 检索只留给剩下 20%。这样能消除大部分知识查询延迟。

5. 首条消息预生成。ElevenLabs Agents 可在通话接通前预生成并缓存首条消息,并设置为不可打断,能减少因网络延迟或提前打断导致的早期掉线。

6. 每通电话都内置评估。Cars24 用 ElevenLabs Agents 对 100% 通话进行评估,检查是否遵循 SOP、客户是否有不满、是否有异常。评估不通过会人工复查,随机抽查每日审核,团队始终主动把控质量。

7. 分阶段逐步扩展。新智能体上线按 5%、10%、20%、50%、100% 逐步推进,每阶段停留两天,确认评估指标稳定后再扩大。

8. 不要主动致电未主动联系的客户。 Cars24 所有外呼都只针对已进入流程的客户。未经请求的 AI 外呼只会增加投诉、损害信任。原则很简单:未主动参与的客户绝不外呼。

9. 客户问是否 AI 时要如实告知。 Cars24 智能体会如实说明自己是虚拟助手。如客户要求人工,立即转接。

观看完整回放将 AI 支出视为投资,而非成本。Cars24 已将 AI 成本纳入年度运营计划,并与具体业务目标挂钩。每次部署都需带来实际业务提升。

观看完整分享

观看完整回放

cars-24-bta

按需观看完整网络研讨会点击这里

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作