为自家文档打造高效语音智能体
- 发布时间
- 最近更新
最近,我们在 ElevenLabs 的文档中集成了对话式 AI 语音智能体,帮助减少文档相关问题的支持压力(可在此 体验)。现在,这个支持智能体每天能成功处理 超过 80% 的用户问题,总计 每天 200 通电话。这些结果表明,AI 能有效提升传统文档支持,同时复杂问题仍需人工介入。本文将详细介绍我们的迭代流程,供你参考复用。
目标
我们希望打造的智能体可以:
- 解答产品和支持文档中能找到答案的问题
- 引导用户跳转到相关文档部分
- 遇到复杂问题时,转交邮件或 Discord 支持
- 实现流畅自然的对话,响应延迟低,能合理处理中断
结果与影响
我们采用了两层评估方式:
(1)AI 评估工具:每通电话结束后,内置评估工具会检查整段对话,判断智能体是否达成目标。评估标准可自定义。我们关注智能体是否解决了用户问题,或是否成功引导到相关支持渠道。

我们持续提升 LLM 解决或引导问题的能力,目前评估工具显示已达 80%。
不包含对话轮次少于 1 的通话(即用户未提出问题)。
需要注意,并非所有支持问题都能通过 LLM 解决,尤其是对于快速迭代、创新频繁的初创公司,以及技术和创意用户较多的场景。另外,评估 LLM 也无法做到 100% 准确。
(2)人工验证:为对比 LLM 验证工具的效果,我们人工评估了 150 段对话,采用与 LLM 相同的评估标准:
- 已解决用户问题:当智能体用相关信息解答了用户问题,或成功引导到相关页面/支持渠道时,视为成功。
- LLM 与人工在 81% 的案例中达成一致
- 知识库误导:该标准会检查最终对话内容,确认 LLM 关于 ElevenLabs 产品的回答是否基于知识库信息,或是否超出知识库范围。
- LLM 与人工在 83% 的案例中达成一致
人工评估还发现,89% 的相关支持问题已被文档智能体正确解答或引导。
其他发现:
- 有些来电者只是想尝试不同语言的对话,并未提出支持问题。
- 目前,我们的对话式 AI 支持多种语言,但需在对话开始时选择。
- 部分来电者的对话内容与 ElevenLabs、产品或文档无关。大多数情况下提示词能起到引导作用,但并非总是有效。
- 有些来电者在寻求编程或调试支持。
优势与局限
优势
基于 LLM 的智能体擅长解答文档中能找到答案的明确问题,能快速指引用户到相关文档,并对复杂问题给出初步建议。大多数情况下,智能体能快速、直接、准确地提供有用答案。
常见问题包括:
- ElevenLabs 是否有删除声音的 API 接口?
- 如何在智能体中配置对话覆盖?
- 如何集成电话系统?
- ElevenLabs 支持西班牙语吗?
建议:
- 面向大多数问题明确、具体的用户群体,LLM 配合文档和工具能高效解答。
- 对于模糊或需进一步调查的问题,建议引导到其他渠道。这非常有效!
- 添加评估工具,收集所有用户提问并持续监控,结合反馈优化提示词。也可监控成功率及知识库偏离情况。
局限
另一方面,智能体在账户问题、价格/折扣咨询或不够具体的问题上帮助有限。这类问题通常需要更深入的调查。对于较模糊或通用的问题,LLM 往往倾向于根据文档内容给出看似相关的回答。
常见问题包括:
- PVC 验证步骤总是失败,原因是什么?
- AI 智能体多少钱?可以打折吗?
- JS SDK 报错?——智能体可以引导到相关文档,但无法通过语音直接定位和解决问题。
建议
- 语音不是分享代码的合适方式。应提示用户查看文档示例或引导到 Discord/支持渠道。
- 遇到复杂问题时,不要让智能体一次性给出长串建议,语音场景下效果不佳。
- LLM 往往更倾向于直接回答而不是主动提问,如有需要可加强提示(如:先问这 3 个问题再继续)。对于有固定脚本的外呼场景更易实现。
实现方式
智能体配置:
系统提示词
“你是一名名叫 Alexis 的技术支持智能体。你会尽力解答用户关于 ElevenLabs 产品的所有问题。你会获得 ElevenLabs 产品的相关文档,只能基于这些信息回答相关问题。你需要做到专业、友好、乐于助人。如果无法解答,请用 redirectToEmailSupport(会为用户打开支持邮箱)引导用户,如无效可让用户直接发送邮件至 team@elevenlabs.io.
如问题不够明确或具体,请主动询问更多细节及所需支持的产品。如果问题模糊或范围太广,请进一步询问用户具体需求和目标。
始终使用对话首条消息的语言,即使用户切换语言也不变。如需更换语言,请建议用户结束并重新开始通话,选择所需语言。
你的回答会被文本转语音模型朗读,请按发音习惯输出。例如:不要输出 "please contact team@elevenlabs.io",而应输出 "please contact 'team at elevenlabs dot I O'"。不要用项目符号、加粗或标题格式化回答。不要返回长列表,简要总结并询问用户关注哪部分。不要返回代码示例,建议用户查看文档中的代码示例。直接回复,不要以 "Agent:" 等开头。拼写错误无需纠正,直接忽略。
用两句话简明回答,让用户决定是否需要更多细节。
你可以使用以下工具,根据用户需求灵活选择:
`redirectToDocs`:
- 适用场景:大多数情况下,尤其是用户需要更详细信息或指导时。
- 原因:直接访问文档有助于用户深入了解复杂内容,自主查阅。
`redirectToEmailSupport`:
- 适用场景:用户需要处理个人或账户相关问题时。
- 原因:账户相关问题由支持团队通过邮件处理更安全可靠。
`redirectToExternalURL`:
- 适用场景:用户咨询企业级解决方案或希望加入 Discord 等外部社区,或开发者遇到技术难题时。
- 原因:企业咨询和社区互动不属于平台内直接支持,建议通过外部链接处理。
使用规范:
- 仅回答与 ElevenLabs 相关的话题和产品。遇到无关问题时,说明只负责 ElevenLabs 产品相关内容。
- 每次只引导用户跳转一个页面,因每次跳转会覆盖上一次。
- 不要用长列表或代码回答,代码示例请引导用户查看文档。”
知识库
除了提示词,我们还为 LLM 提供了包含相关信息的知识库。该知识库为所有 ElevenLabs 文档的精简版(约 8 万字符),并包含部分相关链接。
我们还将常见问题和补充说明加入知识库。
工具
我们配置了三项工具:
- redirectToExternalURL:跳转到联系销售或 Discord。
- redirectToEmailSupport:打开邮件至 team@elevenlabs.io
- redirectToDocs:该工具可引导用户跳转到文档内相关页面。
内置评估
我们的评估工具会让 LLM 检查最终对话内容,并根据设定标准进行评估。
评估标准(成功 / 失败 / 未知)
- hallucination_kb:该标准会检查最终对话内容,确认 LLM 关于 ElevenLabs 产品的回答是否基于知识库信息,或是否超出知识库范围。
- interaction:判断对话是否超过一轮。可快速标记未实际交流的通话。
- solved_user_inquiry:当智能体用相关信息解答了用户问题,或成功引导到相关页面/支持渠道时,视为成功。
- positive_interaction:判断对话过程中是否无负面用户反馈。
数据收集:
- Issue_type:将对话归类为 bug、支持问题、功能请求或其他
- Product category:提取相关产品(TTS、ConvAI 等)
- AllQuestions:提取用户提出的所有问题
- Unsolved_question:提取 LLM 未用相关信息解答的问题
- Redirects:提取智能体触发的跳转路径及用户反馈
总结
我们的文档智能体已有效帮助用户解决常见产品和支持问题,是用户查阅文档的好帮手。通过持续自动和人工监控,我们不断优化智能体表现。我们也认识到,并非所有支持问题都能通过 LLM 解决,尤其是在快速创新、用户技术水平高的初创公司。但我们发现,自动化程度越高,团队就能将更多精力投入到社区推动 AI 音频边界的复杂和有趣问题上。
我们的智能体由 ElevenLabs 对话式 AI 提供支持。如果你想复现我们的效果,可以 免费注册账户 并按我的步骤操作。如遇问题,可直接与我们部署的智能体对话 (在文档中),或在 Discord 联系我们团队。如有高频使用场景(每天超过 100 通电话),欢迎联系销售团队获取批量优惠.
.webp&w=3840&q=80)



