网络研讨会回顾：得克萨斯州米德兰如何打造 24/7 多语种市民服务助手

作者: Briggs Kellogg; Chris Nguyen
发布时间: 2026年3月26日

收听收听本文

0:00

0:000:00

Cars24正在大规模运行生产级语音智能体，覆盖 13 种语言。

本文回顾了 Behind the Agent：Cars24 如何用 Voice AI 自动化超 300 万分钟销售通话，由 Cars24 AI 与创新负责人 Jayesh Gupta 讲解，详细介绍了 Cars24 如何从最初的简单场景，到多智能体架构，逐步搭建并部署语音 AI 系统，支持数百万分钟的客户对话。

大规模语音 AI 的意义

Cars24 是印度最大的二手车平台之一，业务遍及印度、阿联酋和澳大利亚。每月售出 4,000 - 4,500 辆汽车，完成 100,000+ 次检测，促成 22,000+ 次试驾。

他们遇到的挑战并不独特。

市民并不总是知道该找哪个部门，Jackie 不需要他们知道。她会自动分流，能解答的直接答复，确实需要人工时再转接。

演示 1：Jackie 处理账单问题并转接

等待时间越来越长，30 天流程中容易漏掉跟进。

从线索筛选到贷款资料管理，整个流程成本高、难以扩展。

演示 2：Jackie 处理多话题问题

25% 通话量已自动化
近一半销售由 Voice AI 协助完成
通话成本降低 50%

演示 1：Cars24 议价智能体

意义：真实对话不会只围绕一个话题，市民常常会有第二个问题。Jackie 能自然应对话题切换，因为她不是照本宣科，而是基于知识库，针对实际提问作答。

演示内容：

观看完整回放

- 对话自然流畅，延迟低，无机械感停顿

- 智能体在通话中促成车主承诺选择 Cars24

意义：这些智能体能主动销售、处理不确定性、应对异议并推动成交——而且用客户最熟悉的语言。Cars24 发现，语言匹配能直接提升通话时长和业务转化。

演示 2：多智能体协作实现交叉销售

场景：客户错过检测预约。筛选智能体致电重新预约，识别到升级意向后，实时转接给销售智能体，后者无缝衔接对话，继续推进。

演示内容：

- 智能体 1（Sneha）首先说明错过预约并重新安排

- Sneha 询问意图：车主是升级还是因财务原因出售？

- 客户表达升级意向

- Sneha 主动提出转接至合适团队，并在通话中完成转接

- 智能体 2 获取全部上下文，继续推进二手车购买对话

- 客户要求一小时后回电时，智能体确认并总结预约状态，顺利结束通话

意义：该演示展示了多智能体协作的实际效果。每个智能体专注一项任务，信息顺畅传递，无重复、无遗漏。Cars24 正在打造一个 24/7 电话入口，客户可全程自助完成卖车、买车、金融等流程，无需重复说明。

Cars24 技术实现方式

Cars24 从最简单的场景入手：错过预约提醒。通话短、结果明确、出错成本低，便于先验证效果再扩展。

升级到更长、更复杂的呼入通话（如平均 7 分钟、最长 13 分钟的购车咨询）时，单智能体架构遇到瓶颈。

Mini 模型在 3 到 4 分钟后容易丢失上下文。

更大模型则带来延迟。

所有内容塞进一个提示词会让系统脆弱：贷款流程变动可能影响购车流程。

他们的解决方案是多智能体协作，将对话拆分为多个阶段：

小型筛选智能体用 mini 模型捕捉初步意图
客户有意愿并愿意稍等后，由更大模型负责深入咨询
如涉及价格或金融问题，则由第三个专注贷款的智能体介入

每个智能体各司其职，互不影响，修改其中一个不会影响其他部分。

最终技术栈（通过 ElevenAgents 平台协作）：

语音转文本：ElevenLabs Scribe v2 实时转写，适用于 13 种语言的嘈杂二三线环境，准确率高
文本转语音：ElevenLabs Flash 2.5，近期升级至 V3 富表现模式，销售转化率明显提升
LLM：大多数场景用 GPT-4.1 mini，复杂咨询用 GPT-4o 或同级模型，支持更深层推理
电话系统：WebSockets + 24 kHz PCM，保证音质；印度地区供应商包括 Twilio、Exotel、Plivo
集成：自定义 API 调用 ElevenLabs Agents 平台，支持 MCP，并为澳大利亚市场原生集成 HubSpot
向量数据库：Qdrant，采用二进制量化，支持超百万向量大数据集，降低延迟和成本

选择 ElevenLabs Agents 而非单独组装 STT、LLM、TTS 组件，核心原因是延迟。

即使用同样底层模型，自建流程延迟始终超过 1 秒。

Cars24 的最佳实践

Cars24 实践经验总结

1. 从出错成本最低的场景切入。Cars24 首个场景是错过预约提醒——通话短、简单、风险低。先在这里验证模型，建立内部信任，为后续高价值环节积累经验。

2. 用真实客户测试，不要只做模拟。内部测试无法还原真实对话的复杂性。Cars24 直接在 10% 实际流量上试点，接受短期波动，用真实反馈持续优化。

3. 严格限制提示词长度。 Cars24 通话时长 2 分钟以内，提示词上限 4,000-5,000 token。更长会拖慢模型，且效果不稳定。如需更多内容，建议拆分为多个智能体。

4. 常见问题答案直接写进提示词，不放知识库。客户最常问的问题，答案直接写在提示词里。工具调用和 RAG 检索只留给剩下 20%。这样能消除大部分知识查询延迟。

5. 首条消息预生成。ElevenLabs Agents 可在通话接通前预生成并缓存首条消息，并设置为不可打断，能减少因网络延迟或提前打断导致的早期掉线。

6. 每通电话都内置评估。Cars24 用 ElevenLabs Agents 对 100% 通话进行评估，检查是否遵循 SOP、客户是否有不满、是否有异常。评估不通过会人工复查，随机抽查每日审核，团队始终主动把控质量。

7. 分阶段逐步扩展。新智能体上线按 5%、10%、20%、50%、100% 逐步推进，每阶段停留两天，确认评估指标稳定后再扩大。

8. 不要主动致电未主动联系的客户。 Cars24 所有外呼都只针对已进入流程的客户。未经请求的 AI 外呼只会增加投诉、损害信任。原则很简单：未主动参与的客户绝不外呼。

9. 客户问是否 AI 时要如实告知。 Cars24 智能体会如实说明自己是虚拟助手。如客户要求人工，立即转接。

观看完整回放将 AI 支出视为投资，而非成本。Cars24 已将 AI 成本纳入年度运营计划，并与具体业务目标挂钩。每次部署都需带来实际业务提升。

观看完整分享

观看完整回放

按需观看完整网络研讨会点击这里。

网络研讨会回顾：得克萨斯州米德兰如何打造 24/7 多语种市民服务助手

大规模语音 AI 的意义

演示 1：Cars24 议价智能体

演示 2：多智能体协作实现交叉销售

Cars24 技术实现方式

Cars24 实践经验总结

观看完整分享

观看完整回放

相关内容

米德兰市通过 ElevenLabs 驱动的“Jacky”智能助手，减少未接来电并提升市民服务

全新 ElevenLabs Agents

ElevenLabs 智能体现已支持导航 IVR 电话菜单

ElevenLabs Agents 现已支持聊天模式

大规模语音 AI 的意义

演示 1：Cars24 议价智能体

演示 2：多智能体协作实现交叉销售

Cars24 技术实现方式

Cars24 实践经验总结

观看完整分享

观看完整回放

相关内容

米德兰市通过 ElevenLabs 驱动的“Jacky”智能助手，减少未接来电并提升市民服务

全新 ElevenLabs Agents

​​ElevenLabs 智能体现已支持导航 IVR 电话菜单

ElevenLabs Agents 现已支持聊天模式

ElevenLabs 智能体现已支持导航 IVR 电话菜单