为自家文档打造高效语音智能体

作者: Oswin Kruger Ruiz
发布时间: 2025年1月21日
最近更新: 2026年7月7日

收听收听本文

0:00

0:000:00

最近，我们在 ElevenLabs 的文档中集成了对话式 AI 语音智能体，帮助减少文档相关问题的支持压力（可在此体验）。现在，这个支持智能体每天能成功处理超过 80% 的用户问题，总计每天 200 通电话。这些结果表明，AI 能有效提升传统文档支持，同时复杂问题仍需人工介入。本文将详细介绍我们的迭代流程，供你参考复用。

目标

我们希望打造的智能体可以：

解答产品和支持文档中能找到答案的问题
引导用户跳转到相关文档部分
遇到复杂问题时，转交邮件或 Discord 支持
实现流畅自然的对话，响应延迟低，能合理处理中断

结果与影响

我们采用了两层评估方式：

（1）AI 评估工具：每通电话结束后，内置评估工具会检查整段对话，判断智能体是否达成目标。评估标准可自定义。我们关注智能体是否解决了用户问题，或是否成功引导到相关支持渠道。

我们持续提升 LLM 解决或引导问题的能力，目前评估工具显示已达 80%。

不包含对话轮次少于 1 的通话（即用户未提出问题）。

需要注意，并非所有支持问题都能通过 LLM 解决，尤其是对于快速迭代、创新频繁的初创公司，以及技术和创意用户较多的场景。另外，评估 LLM 也无法做到 100% 准确。

（2）人工验证：为对比 LLM 验证工具的效果，我们人工评估了 150 段对话，采用与 LLM 相同的评估标准：

已解决用户问题：当智能体用相关信息解答了用户问题，或成功引导到相关页面/支持渠道时，视为成功。
- LLM 与人工在 81% 的案例中达成一致
知识库误导：该标准会检查最终对话内容，确认 LLM 关于 ElevenLabs 产品的回答是否基于知识库信息，或是否超出知识库范围。
- LLM 与人工在 83% 的案例中达成一致

人工评估还发现，89% 的相关支持问题已被文档智能体正确解答或引导。

其他发现：

有些来电者只是想尝试不同语言的对话，并未提出支持问题。
- 目前，我们的对话式 AI 支持多种语言，但需在对话开始时选择。
部分来电者的对话内容与 ElevenLabs、产品或文档无关。大多数情况下提示词能起到引导作用，但并非总是有效。
有些来电者在寻求编程或调试支持。

优势与局限

优势

基于 LLM 的智能体擅长解答文档中能找到答案的明确问题，能快速指引用户到相关文档，并对复杂问题给出初步建议。大多数情况下，智能体能快速、直接、准确地提供有用答案。

常见问题包括：

ElevenLabs 是否有删除声音的 API 接口？
如何在智能体中配置对话覆盖？
如何集成电话系统？
ElevenLabs 支持西班牙语吗？

建议：

面向大多数问题明确、具体的用户群体，LLM 配合文档和工具能高效解答。
对于模糊或需进一步调查的问题，建议引导到其他渠道。这非常有效！
添加评估工具，收集所有用户提问并持续监控，结合反馈优化提示词。也可监控成功率及知识库偏离情况。

局限

另一方面，智能体在账户问题、价格/折扣咨询或不够具体的问题上帮助有限。这类问题通常需要更深入的调查。对于较模糊或通用的问题，LLM 往往倾向于根据文档内容给出看似相关的回答。

常见问题包括：

PVC 验证步骤总是失败，原因是什么？
AI 智能体多少钱？可以打折吗？
JS SDK 报错？——智能体可以引导到相关文档，但无法通过语音直接定位和解决问题。

建议

语音不是分享代码的合适方式。应提示用户查看文档示例或引导到 Discord/支持渠道。
遇到复杂问题时，不要让智能体一次性给出长串建议，语音场景下效果不佳。
LLM 往往更倾向于直接回答而不是主动提问，如有需要可加强提示（如：先问这 3 个问题再继续）。对于有固定脚本的外呼场景更易实现。

实现方式

智能体配置：

系统提示词

“你是一名名叫 Alexis 的技术支持智能体。你会尽力解答用户关于 ElevenLabs 产品的所有问题。你会获得 ElevenLabs 产品的相关文档，只能基于这些信息回答相关问题。你需要做到专业、友好、乐于助人。如果无法解答，请用 redirectToEmailSupport（会为用户打开支持邮箱）引导用户，如无效可让用户直接发送邮件至 team@elevenlabs.io.

如问题不够明确或具体，请主动询问更多细节及所需支持的产品。如果问题模糊或范围太广，请进一步询问用户具体需求和目标。

始终使用对话首条消息的语言，即使用户切换语言也不变。如需更换语言，请建议用户结束并重新开始通话，选择所需语言。

你的回答会被文本转语音模型朗读，请按发音习惯输出。例如：不要输出 "please contact team@elevenlabs.io"，而应输出 "please contact 'team at elevenlabs dot I O'"。不要用项目符号、加粗或标题格式化回答。不要返回长列表，简要总结并询问用户关注哪部分。不要返回代码示例，建议用户查看文档中的代码示例。直接回复，不要以 "Agent:" 等开头。拼写错误无需纠正，直接忽略。

用两句话简明回答，让用户决定是否需要更多细节。

你可以使用以下工具，根据用户需求灵活选择：

`redirectToDocs`：

- 适用场景：大多数情况下，尤其是用户需要更详细信息或指导时。

- 原因：直接访问文档有助于用户深入了解复杂内容，自主查阅。

`redirectToEmailSupport`：

- 适用场景：用户需要处理个人或账户相关问题时。

- 原因：账户相关问题由支持团队通过邮件处理更安全可靠。

`redirectToExternalURL`：

- 适用场景：用户咨询企业级解决方案或希望加入 Discord 等外部社区，或开发者遇到技术难题时。

- 原因：企业咨询和社区互动不属于平台内直接支持，建议通过外部链接处理。

使用规范：

- 仅回答与 ElevenLabs 相关的话题和产品。遇到无关问题时，说明只负责 ElevenLabs 产品相关内容。

- 每次只引导用户跳转一个页面，因每次跳转会覆盖上一次。

- 不要用长列表或代码回答，代码示例请引导用户查看文档。”

知识库

除了提示词，我们还为 LLM 提供了包含相关信息的知识库。该知识库为所有 ElevenLabs 文档的精简版（约 8 万字符），并包含部分相关链接。

我们还将常见问题和补充说明加入知识库。

工具

我们配置了三项工具：

redirectToExternalURL：跳转到联系销售或 Discord。
redirectToEmailSupport：打开邮件至 team@elevenlabs.io
redirectToDocs：该工具可引导用户跳转到文档内相关页面。

内置评估

我们的评估工具会让 LLM 检查最终对话内容，并根据设定标准进行评估。

评估标准（成功 / 失败 / 未知）

hallucination_kb：该标准会检查最终对话内容，确认 LLM 关于 ElevenLabs 产品的回答是否基于知识库信息，或是否超出知识库范围。
interaction：判断对话是否超过一轮。可快速标记未实际交流的通话。
solved_user_inquiry：当智能体用相关信息解答了用户问题，或成功引导到相关页面/支持渠道时，视为成功。
positive_interaction：判断对话过程中是否无负面用户反馈。

数据收集：

Issue_type：将对话归类为 bug、支持问题、功能请求或其他
Product category：提取相关产品（TTS、ConvAI 等）
AllQuestions：提取用户提出的所有问题
Unsolved_question：提取 LLM 未用相关信息解答的问题
Redirects：提取智能体触发的跳转路径及用户反馈

总结

我们的文档智能体已有效帮助用户解决常见产品和支持问题，是用户查阅文档的好帮手。通过持续自动和人工监控，我们不断优化智能体表现。我们也认识到，并非所有支持问题都能通过 LLM 解决，尤其是在快速创新、用户技术水平高的初创公司。但我们发现，自动化程度越高，团队就能将更多精力投入到社区推动 AI 音频边界的复杂和有趣问题上。

我们的智能体由 ElevenLabs 对话式 AI 提供支持。如果你想复现我们的效果，可以免费注册账户并按我的步骤操作。如遇问题，可直接与我们部署的智能体对话（在文档中），或在 Discord 联系我们团队。如有高频使用场景（每天超过 100 通电话），欢迎联系销售团队获取批量优惠.

为自家文档打造高效语音智能体

目标

结果与影响

优势与局限

优势

局限

实现方式

智能体配置：

系统提示词

知识库

工具

内置评估

总结

相关内容

全新对话式 AI 智能体

认识 Flash

如何将 ElevenLabs 对话式 AI 小组件添加到 Framer 网站

如何将 ElevenLabs 对话式 AI 小组件添加到 WordPress 网站