跳到内容

为自家文档打造高效语音智能体

成功解决超过 80% 用户问题

Docs Blog Cover 1x1

最近,我们在 ElevenLabs 的文档中集成了对话式 AI 语音智能体,帮助减少文档相关问题的支持压力(可在此 体验)。现在,这个支持智能体每天能成功处理 超过 80% 的用户问题,总计 每天 200 通电话。这些结果表明,AI 能有效提升传统文档支持,同时复杂问题仍需人工介入。本文将详细介绍我们的迭代流程,供你参考复用。

目标

我们希望打造的智能体可以:

  • 解答产品和支持文档中能找到答案的问题
  • 引导用户跳转到相关文档部分
  • 遇到复杂问题时,转交邮件或 Discord 支持
  • 实现流畅自然的对话,响应延迟低,能合理处理中断

结果与影响

我们采用了两层评估方式:

(1)AI 评估工具:每通电话结束后,内置评估工具会检查整段对话,判断智能体是否达成目标。评估标准可自定义。我们关注智能体是否解决了用户问题,或是否成功引导到相关支持渠道。

Solved User Inquiry Chart

我们持续提升 LLM 解决或引导问题的能力,目前评估工具显示已达 80%。

不包含对话轮次少于 1 的通话(即用户未提出问题)。

需要注意,并非所有支持问题都能通过 LLM 解决,尤其是对于快速迭代、创新频繁的初创公司,以及技术和创意用户较多的场景。另外,评估 LLM 也无法做到 100% 准确。

(2)人工验证:为对比 LLM 验证工具的效果,我们人工评估了 150 段对话,采用与 LLM 相同的评估标准:

  • 已解决用户问题:当智能体用相关信息解答了用户问题,或成功引导到相关页面/支持渠道时,视为成功。
    • LLM 与人工在 81% 的案例中达成一致
  • 知识库误导:该标准会检查最终对话内容,确认 LLM 关于 ElevenLabs 产品的回答是否基于知识库信息,或是否超出知识库范围。
    • LLM 与人工在 83% 的案例中达成一致

人工评估还发现,89% 的相关支持问题已被文档智能体正确解答或引导。

其他发现:

  • 有些来电者只是想尝试不同语言的对话,并未提出支持问题。
    • 目前,我们的对话式 AI 支持多种语言,但需在对话开始时选择。
  • 部分来电者的对话内容与 ElevenLabs、产品或文档无关。大多数情况下提示词能起到引导作用,但并非总是有效。
  • 有些来电者在寻求编程或调试支持。

优势与局限

优势

基于 LLM 的智能体擅长解答文档中能找到答案的明确问题,能快速指引用户到相关文档,并对复杂问题给出初步建议。大多数情况下,智能体能快速、直接、准确地提供有用答案。

常见问题包括:

  • ElevenLabs 是否有删除声音的 API 接口?
  • 如何在智能体中配置对话覆盖?
  • 如何集成电话系统?
  • ElevenLabs 支持西班牙语吗?

建议:

  • 面向大多数问题明确、具体的用户群体,LLM 配合文档和工具能高效解答。
  • 对于模糊或需进一步调查的问题,建议引导到其他渠道。这非常有效!
  • 添加评估工具,收集所有用户提问并持续监控,结合反馈优化提示词。也可监控成功率及知识库偏离情况。

局限

另一方面,智能体在账户问题、价格/折扣咨询或不够具体的问题上帮助有限。这类问题通常需要更深入的调查。对于较模糊或通用的问题,LLM 往往倾向于根据文档内容给出看似相关的回答。

常见问题包括:

  • PVC 验证步骤总是失败,原因是什么?
  • AI 智能体多少钱?可以打折吗?
  • JS SDK 报错?——智能体可以引导到相关文档,但无法通过语音直接定位和解决问题。

建议

  • 语音不是分享代码的合适方式。应提示用户查看文档示例或引导到 Discord/支持渠道。
  • 遇到复杂问题时,不要让智能体一次性给出长串建议,语音场景下效果不佳。
  • LLM 往往更倾向于直接回答而不是主动提问,如有需要可加强提示(如:先问这 3 个问题再继续)。对于有固定脚本的外呼场景更易实现。

实现方式

智能体配置:

系统提示词

“你是一名名叫 Alexis 的技术支持智能体。你会尽力解答用户关于 ElevenLabs 产品的所有问题。你会获得 ElevenLabs 产品的相关文档,只能基于这些信息回答相关问题。你需要做到专业、友好、乐于助人。如果无法解答,请用 redirectToEmailSupport(会为用户打开支持邮箱)引导用户,如无效可让用户直接发送邮件至 team@elevenlabs.io.

如问题不够明确或具体,请主动询问更多细节及所需支持的产品。如果问题模糊或范围太广,请进一步询问用户具体需求和目标。

始终使用对话首条消息的语言,即使用户切换语言也不变。如需更换语言,请建议用户结束并重新开始通话,选择所需语言。

你的回答会被文本转语音模型朗读,请按发音习惯输出。例如:不要输出 "please contact team@elevenlabs.io",而应输出 "please contact 'team at elevenlabs dot I O'"。不要用项目符号、加粗或标题格式化回答。不要返回长列表,简要总结并询问用户关注哪部分。不要返回代码示例,建议用户查看文档中的代码示例。直接回复,不要以 "Agent:" 等开头。拼写错误无需纠正,直接忽略。

用两句话简明回答,让用户决定是否需要更多细节。

你可以使用以下工具,根据用户需求灵活选择:

`redirectToDocs`:

- 适用场景:大多数情况下,尤其是用户需要更详细信息或指导时。

- 原因:直接访问文档有助于用户深入了解复杂内容,自主查阅。

`redirectToEmailSupport`:

- 适用场景:用户需要处理个人或账户相关问题时。

- 原因:账户相关问题由支持团队通过邮件处理更安全可靠。

`redirectToExternalURL`:

- 适用场景:用户咨询企业级解决方案或希望加入 Discord 等外部社区,或开发者遇到技术难题时。

- 原因:企业咨询和社区互动不属于平台内直接支持,建议通过外部链接处理。

使用规范:

- 仅回答与 ElevenLabs 相关的话题和产品。遇到无关问题时,说明只负责 ElevenLabs 产品相关内容。

- 每次只引导用户跳转一个页面,因每次跳转会覆盖上一次。

- 不要用长列表或代码回答,代码示例请引导用户查看文档。”

知识库

除了提示词,我们还为 LLM 提供了包含相关信息的知识库。该知识库为所有 ElevenLabs 文档的精简版(约 8 万字符),并包含部分相关链接。

我们还将常见问题和补充说明加入知识库。

工具

我们配置了三项工具:

  • redirectToExternalURL:跳转到联系销售或 Discord。
  • redirectToEmailSupport:打开邮件至 team@elevenlabs.io
  • redirectToDocs:该工具可引导用户跳转到文档内相关页面。

内置评估

我们的评估工具会让 LLM 检查最终对话内容,并根据设定标准进行评估。

评估标准(成功 / 失败 / 未知)

  • hallucination_kb:该标准会检查最终对话内容,确认 LLM 关于 ElevenLabs 产品的回答是否基于知识库信息,或是否超出知识库范围。
  • interaction:判断对话是否超过一轮。可快速标记未实际交流的通话。
  • solved_user_inquiry:当智能体用相关信息解答了用户问题,或成功引导到相关页面/支持渠道时,视为成功。
  • positive_interaction:判断对话过程中是否无负面用户反馈。

数据收集:

  • Issue_type:将对话归类为 bug、支持问题、功能请求或其他
  • Product category:提取相关产品(TTS、ConvAI 等)
  • AllQuestions:提取用户提出的所有问题
  • Unsolved_question:提取 LLM 未用相关信息解答的问题
  • Redirects:提取智能体触发的跳转路径及用户反馈

总结

我们的文档智能体已有效帮助用户解决常见产品和支持问题,是用户查阅文档的好帮手。通过持续自动和人工监控,我们不断优化智能体表现。我们也认识到,并非所有支持问题都能通过 LLM 解决,尤其是在快速创新、用户技术水平高的初创公司。但我们发现,自动化程度越高,团队就能将更多精力投入到社区推动 AI 音频边界的复杂和有趣问题上。

我们的智能体由 ElevenLabs 对话式 AI 提供支持。如果你想复现我们的效果,可以 免费注册账户 并按我的步骤操作。如遇问题,可直接与我们部署的智能体对话 (在文档中),或在 Discord 联系我们团队。如有高频使用场景(每天超过 100 通电话),欢迎联系销售团队获取批量优惠.

查看更多 ElevenLabs 团队的文章

用高质量 AI 音频创作