
文本转语音与语音转文本:有何不同?
- 分类
- 资源
- 日期
结构清晰、可靠的知识库对于语音智能体在员工和客户互动中提供准确、一致、符合公司要求的回复至关重要。
随着企业开始采用 语音智能体 来支持员工和客户,智能体所依赖的信息质量成为影响其表现的关键因素。智能体具备一定的推理能力,但如果需要体现公司政策、产品细节或内部流程,就必须依赖可靠且结构化的知识。
智能体知识库为此提供基础和专业化支持。它们存储文档、政策、技术参考、产品规格、支持资料及其他内部资源。为确保高效使用,内容需经过筛选、整理和结构化,帮助智能体生成准确、有依据的答案,而不是依赖可能不完整或过时的通用模型知识。
本指南介绍在智能体部署中管理企业知识库的实用策略,帮助语音智能体在处理大量、多样化文档时依然保持一致表现。
可直接在 ElevenLabs Agents 平台配置知识库,内容将在对话中供智能体使用。
平台提供两种内容使用方式:
选择直接注入还是 RAG,主要取决于知识库的大小。
以“产品手册库”为例,包含 1000 份文档,总计约 200 万词(约 260 万 tokens)。此时直接注入会超出大多数高效 LLM 的上下文限制,因此启用 RAG,仅检索相关片段,无论知识库总量多大,都能保持上下文可控。
相反,对于 4 页的政策文档(约 3000 tokens),直接注入更快更简单,RAG 反而会增加不必要的延迟。
ElevenLabs 平台会自动处理:只有当知识库达到适合检索的规模时,才会开放 RAG 选项。
如果企业内部文档量大且类型多,第一步不是上线,而是筛选。优质来源带来优质答案,低质量来源则容易引入错误和幻觉。
先筛选再上线。归档或删除过时草稿、被替代版本和无关资料。不应用于客户答复的文档不应放入知识库。这样可确保信息来源可靠,检索时减少干扰。
按领域分类整理。将剩余文档按 HR 政策、产品文档、法律协议、技术手册、客户支持流程等逻辑类别分组。领域分类在 ElevenLabs 平台实现多智能体工作流时尤为重要,便于专业智能体处理各自知识领域。
重质不重量。少量高质量文档的知识库,效果远胜于大量混杂文件。每个领域都应注重内容完整、准确和相关性。数据干净、结构清晰,不仅是最佳实践,更决定了智能体能否带来优质体验,避免无关或矛盾答复。
确定知识内容和访问方式后,下一步是如何搭建智能体架构以高效访问知识库。企业可在 ElevenLabs Agents 平台选择五种架构方式,按知识规模和需求从简单到复杂灵活配置。
1. 单智能体知识库
最简单的方式是将知识库直接关联到单个智能体。将整理好的文档上传到 ElevenLabs Agent 平台,创建知识库并在配置中分配给智能体,无需工作流、路由或外部工具。此方式上线最快,适合 HR 政策、产品文档或单一产品线客户支持等专注场景。
但在大规模应用时会有局限。知识库过大或内容过于多样时,性能可能下降。缺乏专业化时,智能体需检索所有文档,涉及不同主题时相关性降低。若发现准确率因知识库多样性下降,就该升级为多智能体工作流。
2. 多智能体知识分区
对于大体量、多类型文档,多智能体工作流架构可高效扩展。编排智能体分析问题并路由到各自领域的专业智能体,每个智能体只访问本领域知识库。例如,用户问“加州的陪产假政策是什么?”,系统识别为 HR 相关,路由到 HR 专业智能体,仅访问 HR 文档。
实施时需为每个领域创建独立知识库,搭建包含专业节点的工作流,并配置路由条件。小而专注的上下文提升准确率、降低延迟,领域分离也便于各自独立维护。适合需要覆盖多个主题领域的企业。
3. 混合模式:知识库用于理解,工具用于数据
此模式将理解与查找分离。知识库用于识别术语并映射到系统标识符(作为文档加入知识库),而 webhook 工具则从权威数据源实时获取最新数据。
例如,用户问“我的 Premium Plus 套餐详情是什么?”,智能体先用知识库识别套餐 ID PLAN_001,再调用工具查询实时数据库,获取当前价格和功能。
这样可确保答案准确,数据来自数据库而非 LLM 生成,实时反映最新状态,并通过工具调用日志形成审计记录。适用于既需理解文档又需结构化数据检索的场景,如客户支持、账户管理、电商等,文档解释概念,数据库存储实时数据。
4. 外部向量数据库
企业可自主管理向量数据库(如 Pinecone、Weaviate、Qdrant),并通过自定义 webhook 工具接入。这样可完全控制分片、嵌入和检索算法,但需承担基础设施运维和外部 API 调用带来的延迟。灵活性提升的同时,也增加了运维负担和外部延迟。
5. 双脑架构
部分企业已拥有自有(微调过的)LLM,最有效的连接方式是直接通过 ElevenLabs Agent 平台(自定义 LLM)或采用双脑架构。
双脑架构(两套 LLM 同时运行)通常用于自定义 LLM 速度不足以支撑实时对话的场景。此时,智能体由更快的 LLM 驱动,必要时调用客户自有 LLM 获取深度推理或补充上下文,并将结果通过上下文更新加入对话。
由于调用为异步,前端对话依然流畅,后端可进行复杂计算。此方案便于企业在现有 AI 基础上扩展能力。
高效语音智能体依赖清晰、结构化的知识。企业信息结构合理、准确且便于智能体检索时,才能成为可靠的信息来源,助力智能体输出有依据、一致的回复。
ElevenLabs 平台原生支持知识库管理、多智能体工作流、webhook 集成及完善的 API,协同无缝。结合干净数据和合适架构,企业知识可通过自然对话高效获取。做好这些,不只是技术细节,更是运营优势。
上传前先合并。与其上传 500 个单独文件,不如将同一领域文档合并为一个文件。这样管理更简单,智能体配置更方便,相关内容集中检索效果更好。
按需分组文档,可按产品线、地区、部门或职能分组。每个合并后的知识库对应一个智能体(单智能体)或一个专业智能体节点(多智能体工作流)。
利用 ElevenLabs API,可通过 URL、文本或文件上传内容。将上传集成到 CI/CD 流程,源文档变更时自动合并和更新。
监控文档库 (Git、SharePoint、CMS)。检测到变更时,自动触发重新处理,合并更新后的文档。
通过 API 实现知识库自动更新。 典型流程:文档更新 → 触发 CI/CD 流程 → 文档合并 → 调用 API 替换知识库 → 智能体即时获取最新信息。
像管理代码一样管理文档。 知识库更新应像代码部署一样严格。平台 API 优先架构便于集成现有流程,无需人工干预即可保持准确性和合规性。



.webp&w=3840&q=80)