Skip to content

知识库接入指南

知识库提供可靠的数据来源,能够缓解大模型幻觉、适配行业知识或企业内部资料。通过合理的召回策略,智能体可以在对话中引用相关内容并附带出处。


支持的知识库类型

  • 文本知识库:上传 PDF、Word、Markdown、TXT 等文档,系统自动切分片段并建立向量索引。
  • 表格知识库:导入 CSV/Excel,支持根据索引列或 NL2SQL 查询结构化数据。
  • 图片知识库:上传 JPG/PNG 等,结合标签与描述实现图像检索。
  • 火山知识库:使用火山引擎的企业级知识库资源,可复用标签与权限能力。

创建与导入步骤

  1. 在智能体编排页左侧点击 + 知识 → 选择创建方式(上传文件、抓取网页、同步第三方等)。

知识库配置界面

  1. 配置知识库名称、描述与标签,便于检索时识别。

知识库详情设置

  1. 上传或同步数据后,可在知识库详情页查看解析状态,必要时重新切分或删除片段。
  2. 将知识库添加到智能体或工作流中,并在提示词中说明调用策略。

召回配置

  • 调用方式
    • 按需调用:模型根据提示词判断是否检索知识库,适合多来源混用的场景。
    • 自动调用:每轮对话都会检索知识库,适合强依赖资料的问答机器人。
  • 召回条数 / 阈值:根据业务调整返回的片段数量、置信度下限。
  • 知识库优先级:在「召回配置」中可调整不同知识库的顺序。

如果按需调用仍无法召回,建议在提示词中明确说明“必须使用知识库回答”,或切换到自动调用模式。


火山知识库高级配置

  • 支持使用标签过滤数据,例如 doc_id contains 123456
  • 标签名、操作符与取值需在火山知识库侧预先配置。
  • 标签值可绑定变量,实现按用户身份或上下文动态筛选。

调试与维护

  • 在「预览与调试」观察运行详情,确认召回的片段内容与来源。

召回结果示意

  • 定期清理或更新知识库,确保内容新鲜;可通过批量删除或重新上传实现。
  • 对包含敏感信息的知识库,务必设置访问权限并遵守合规要求。

常见问题

  • 提示词已要求使用知识库但未召回?
    检查知识库名称是否正确、调用方式是否为按需、提示词是否描述清晰,可尝试切换为自动调用。

  • 文档导入失败或内容缺失?
    确认文件格式与大小符合要求,复杂文档可先转为 Markdown/TXT 再上传。

  • 如何区分多知识库来源?
    在知识库管理界面设置标签或命名规范,并在提示词中指明优先顺序。