一、知识库

知识库是一个巨大的数据集合。

1、结构化知识库:指数据格式规范、有固定结构、易被机器解析和检索的知识集合,核心特征是 “结构化、强关联、可高效查询”,适合智能体快速精准提取特定知识。

(1)核心存储形式

①关系型数据库(MySQL/PostgreSQL):以 “表 – 行 – 列” 存储,如电商智能体的商品信息(ID、名称、价格、库存);

②非关系型结构化库(MongoDB/Redis):以文档 / 键值对存储,如客服智能体的用户问题 – 答案映射表;

③知识图谱(Neo4j/JanusGraph):以 “实体 – 关系 – 属性” 的图结构存储,如医疗智能体的 “疾病 – 症状 – 药物” 关联知识;

④表格 / Excel/CSV:轻量结构化形式,如教育智能体的学科知识点清单。

(2)核心优势

①检索效率极高,支持精准的条件查询(如按 ID、属性筛选);

②知识关联明确,机器可直接理解实体间的逻辑关系;

③易更新、易维护,可通过数据库操作实现知识的增删改查。

(3)适用场景:智能体需要精准提取特定信息的场景,如金融智能体查交易规则、政务智能体查办事流程、工业智能体查设备参数。

2、非结构化知识库:指无固定格式、机器难以直接解析的知识集合,是现实中最常见的知识形式,核心特征是 “形式自由、包含海量语义信息”,需要通过自然语言处理(NLP)进行解析。

(1)核心存储形式

①文本类:PDF 文档、Word、TXT、Markdown、网页文章、行业报告、书籍、聊天记录;

②多媒体类:图片、音频、视频、语音转文字稿(需先转文本再处理);

③半结构化文本:HTML、XML、JSON(介于结构化与非结构化之间,有基础格式但语义自由)。

(2)核心问题:原始形式无法被机器直接检索和理解,需先通过文本抽取、向量化等处理,转化为机器可识别的形式。

(3)适用场景:智能体需要理解复杂语义、挖掘隐性知识的场景,如法律智能体解析法条文档、科研智能体阅读论文、企业智能体分析行业报告。

3、知识库与RAG的协同管理

(1)、核心痛点:大模型的先天不足大模型的预训练知识存在知识过时(训练数据有时间窗口)、领域知识匮乏(通用模型不精通垂直领域)、易产生幻觉(编造不存在的知识)三大问题,无法直接作为智能体的知识库。

(2)、RAG 的核心价值RAG 是 “检索 + 生成” 的融合技术,核心逻辑是:让大模型在生成答案前,先从外部知识库中检索与问题相关的真实知识,再基于检索到的知识生成答案,而非仅依赖自身预训练知识。

(3)、知识库与 RAG 的协同核心

核心定位:知识库是 RAG 的 “知识来源”,RAG 是知识库的 “调用入口”;

知识库的作用:为 RAG 提供经过整理、校验的领域知识,保证知识的真实性和专业性;

RAG 的作用:为智能体提供 “从知识库中找知识→用大模型加工知识→生成答案” 的端到端能力,让智能体既能利用知识库的海量知识,又能利用大模型的自然语言理解和生成能力;

通俗理解:知识库是智能体的 “书库”,RAG 是智能体的 “图书管理员 + 撰稿人”,图书管理员负责从书库中找相关书籍,撰稿人负责基于找到的书籍写答案。

简单来说:知识库是智能体的 “书库”,RAG 是智能体的 “图书管理员 + 撰稿人”,图书管理员负责从书库中找相关书籍,撰稿人负责基于找到的书籍写答案。

RAG 的工作流分为离线预处理阶段和在线推理阶段,离线阶段是对知识库的 “加工准备”,在线阶段是对用户问题的 “实时处理”,以下是工业级通用的 RAG 工作流,适配 90% 以上的智能体场景。

典型 RAG 工作流框图

【离线预处理阶段】—— 仅需执行1次/知识库更新时执行
非结构化知识库/结构化知识库
        ↓
步骤1:知识加载(Load)—— 读取各类格式的知识文件
        ↓
步骤2:知识分割(Split)—— 将长文本切分为短片段(避免大模型上下文超限)
        ↓
步骤3:知识向量化(Embed)—— 将文本片段转化为数值型向量(嵌入向量)
        ↓
步骤4:向量存储(Store)—— 将向量和原始文本存入向量数据库
        ┌─────────────────────────────────┐
        │                                 │
        ▼                                 │
【在线推理阶段】—— 对每个用户问题实时执行  <─── 知识库更新时触发离线阶段重跑
用户提出问题(Query)
        ↓
步骤5:问题向量化(Embed)—— 将用户问题转化为相同维度的嵌入向量
        ↓
步骤6:相似性检索(Retrieve)—— 向量数据库中检索与问题向量最相似的知识片段
        ↓
步骤7:知识重排(Rerank)—— 对检索结果排序,保留最相关的Top-N片段(提升精准度)
        ↓
步骤8:提示词构造(Prompt)—— 将问题+相关知识片段拼接为大模型可识别的提示词
        ↓
步骤9:生成答案(Generate)—— 大模型基于提示词生成答案(不脱离检索到的知识)
        ↓
最终答案返回给用户
二、插件

1、智能体插件的核心定义

智能体插件是为智能体拓展功能、对接外部资源 / 系统的模块化程序,是脱离智能体本体的独立功能单元,可按需接入 / 卸载,让智能体在基础能力外,快速获得专业领域能力、外部工具调用能力和跨系统交互能力,无需重新训练或重构智能体核心模型。

2、智能体插件的核心特征

(1)模块化:独立开发、独立部署,与智能体核心解耦,单个插件对应一类具体功能,互不干扰;

(2)可插拔:支持灵活接入和卸载,根据智能体的应用场景按需组合插件,实现功能的动态扩展;

(3)适配性:遵循智能体的插件调用协议,能与智能体的核心推理引擎、知识库、交互模块无缝对接;

(4)轻量化:聚焦单一功能开发,体积小、调用效率高,不会过度占用智能体的运行资源。

3、智能体插件的主要类型及应用示例

(1)工具调用类插件:对接各类实用工具,拓展智能体的操作能力,如计算器插件、地图导航插件、文档编辑插件、代码运行插件、邮件发送插件等,例:编程智能体通过代码运行插件直接执行用户编写的代码并返回结果;

(2)领域服务类插件:承载垂直领域的专业能力,补充智能体的领域知识和业务逻辑,如金融行情插件、医疗问诊插件、法律条文解析插件、电商商品查询插件、工业设备监测插件等,例:金融智能体通过行情插件实时获取股票、基金的最新数据并做分析;

(3)数据交互类插件:实现智能体与外部数据库、系统、平台的数据互通,如数据库访问插件、ERP 系统对接插件、知识库同步插件、第三方 API 调用插件等,例:企业智能体通过 ERP 插件直接调取公司的销售、库存数据并生成报表;

(4)多媒体处理类插件:让智能体具备音视频、图片的处理能力,如图片识别插件、语音转文字插件、视频剪辑插件、OCR 文字提取插件等,例:办公智能体通过 OCR 插件提取图片中的文字并整理成文档。

4、智能体插件的核心价值

(1)降低开发成本:无需为智能体开发所有功能,通过接入现成插件快速实现功能拓展,提升智能体的开发效率;

(2)提升场景适配性:可根据不同的应用场景组合不同插件,让同一个智能体适配多领域、多场景的需求,实现 “一核多能”;

(3)便于迭代更新:插件可单独进行版本升级、功能优化,无需修改智能体核心代码,降低智能体的维护难度;

(4)弥补核心能力短板:解决智能体本身在工具操作、实时数据、跨系统交互等方面的不足,让智能体的能力更全面、更实用。

5、插件与智能体的协同逻辑智能体的核心推理引擎负责接收用户需求、分析任务逻辑、判断所需功能,随后根据任务需求自动调用对应的插件,插件完成具体的操作、数据处理 、服务请求后,将结果返回给智能体核心引擎,引擎再对结果进行整合、加工,最终以自然语言的形式向用户反馈,形成 “需求接收 – 插件调用 – 结果处理 – 答案生成” 的完整流程。

三、工作流

1、智能体工作流的核心定义

智能体工作流是智能体接收用户需求后,从需求解析任务执行再到结果反馈的标准化、自动化处理流程,是智能体整合自身推理能力、知识库、插件工具、外部资源完成目标任务的全链路逻辑,其核心是按预设规则、自主推理实现任务的分步拆解与闭环执行,不同场景的智能体可基于核心流程适配个性化环节。

2、智能体工作流的核心执行步骤

电商客服智能体处理用户问题 “帮我查一下我买的 XX 卫衣的物流,还没收到货,能不能加急?” 为例,拆解通用工作流的执行过程,该流程适配绝大多数场景的智能体,可按需增减环节

(1)需求接收与解析:智能体通过对话窗口、接口等渠道接收用户自然语言需求,依托 NLP 能力完成意图识别、关键信息提取,本案例中提取核心意图为 “查询 XX 卫衣物流 + 申请物流加急”,关键信息为 “订单商品:XX 卫衣、用户诉求:查物流 + 加急”;

(2)任务拆解与资源匹配:智能体的核心推理引擎将整体任务拆解为可执行的子任务,同时匹配完成子任务所需的资源 与工具,本案例中拆解为 2 个子任务,子任务 1 “查询物流” 匹配电商订单数据库插件,子任务 2 “申请加急” 匹配物流对接插件 + 人工客服对接规则

(3)子任务执行与资源调用:智能体按拆解顺序自动执行子任务,需调用插件、知识库、外部系统时,发起请求并获取返回结果,本案例中先调用电商订单数据库插件,根据用户信息匹配订单,提取物流单号并查询物流轨迹(结果:快件在 XX 分拣中心,未发出),再调用物流对接插件提交加急申请,插件反馈 “普通快递暂不支持加急,可协调优先分拣”;

(4)结果整合与加工:智能体将各子任务的执行结果进行汇总、筛选、整理,结合自然语言生成能力,转化为用户易懂的表述,同时根据预设规则补充相关建议,本案例中整合结果为 “XX 卫衣物流轨迹:快件目前在 XX 分拣中心待发出;加急申请:普通快递暂不支持加急,已为你协调物流方优先分拣”,补充建议 “预计今日内发出,发出后会同步物流信息,你可随时查问”;

(5)结果反馈与交互闭环:智能体将加工后的结果通过原渠道反馈给用户,若用户有后续追问 / 新需求,自动回到 “需求接收与解析” 环节,形成交互闭环,本案例中向用户发送整合后的物流信息与加急结果,若用户继续问 “什么时候能到”,则再次启动流程拆解新任务。

3、智能体工作流的核心好处

(1)任务处理标准化:通过固定的全链路流程,保证智能体处理同类任务的一致性,避免因无规则执行导致的结果偏差,如所有电商客服智能体查询物流的流程统一,不会出现不同用户查询得到不同格式结果的情况;

(2)提升任务执行效率:实现从需求解析到结果反馈的自动化处理,无需人工介入基础任务,大幅缩短处理时间,如物流查询任务,智能体可秒级响应,远快于人工客服手动查单;

(3)支持复杂任务拆解:能将用户的复杂自然语言需求拆解为多个简单子任务,逐个执行并整合结果,解决单一能力无法完成复杂任务的问题,如用户需求 “查一下我的订单物流,再帮我改一下收货地址,顺便推荐同款不同色的卫衣”,智能体可拆解为查物流、改地址、商品推荐三个子任务并依次完成;

(4)实现资源的高效整合:在流程中可灵活对接知识库、插件、外部系统等各类资源,让智能体的能力形成互补,无需单独开发各类功能,如客服智能体通过插件对接订单库、物流系统、商品库,一站式完成用户的各类基础诉求;

(5)降低人工依赖与运营成本:基础、重复性的任务由智能体按工作流自动完成,人工仅需处理智能体无法解决的复杂问题(如物流丢件、退款纠纷),减少人工工作量,降低企业运营成本;

(6)具备可扩展性与适配性:工作流的各环节为模块化设计,可根据不同场景、不同行业的需求,灵活增减环节、匹配不同资源,如将电商客服智能体的工作流稍作调整,即可适配政务智能体、金融智能体等其他场景;

(7)形成可追溯的任务链路:工作流的每一个环节都有执行记录,可追溯任务的处理过程、资源调用情况、结果生成依据,便于后续的问题排查、流程优化与数据统计,如智能体处理物流查询出错时,可通过流程记录排查是插件调用失败还是信息提取错误。

4、智能体工作流的核心特点智能体工作流并非完全固定的 “硬规则”,部分高阶智能体的工作流具备自主推理调整能力,可根据用户需求的复杂程度、资源的可用情况,自主调整子任务的执行顺序、匹配更合适的资源,如用户需求模糊时,会在 “需求接收与解析” 环节增加 “向用户确认关键信息” 的子环节,再继续后续流程,让工作流更贴合实际的交互场景。