1.了解智能体

这个时代,AI开始已经深入到我们生活中了,智能体的概念也慢慢出现在我们的视野中了。这两个概念并不完全一样。AI 是模拟人类智能的技术领域与能力集合,智能体是依托 AI 实现自主感知、决策、 行动的目标驱动实体,后者是前者的具体应用形态之一。AI 是解决智能问题的 “工具箱”,智能体是用工具箱完成具体任务的 “执行者”。前者关注 “如何让机器变聪明”,后者聚焦 “如何让聪明的机器自主完成任务”。随着大模型普及,AI 智能体正成为主流,核心是为 AI 赋予 “行动能力” 与 “闭环逻辑”,适配更复杂的自动化场景。

2.智能体的本质

智能体的本质是:大模型+任务规划+工具调用+记忆深化。

智能体能够感知环境、自主决策、并执行任务,其核心在于大语言模型(LLM)的 推理能力与环境交互能力深度融合。

需要注意的是以下两点:

(1)大模型与用户之间的交互是基于提示词实现的,用户的提示词是否清晰准确会影响大模型的回答的效果。

(2)需要给定一个目标,智能体就能够针对目标独立思考并作出行动。

一个基于大模型的智能体一般分为四个部分。

3.智能体的特性

(1)自主性

智能体无需人类过多干预,可以根据目标进行自主拆解、规划任务。例如,我们打算去新疆旅游。智能体可以自动生成“查询线路—>规划线路—>筛选热门景点门票信息—>查询天气信息——>制定详细的完整流程”。

上面的过程很多AI也支持,但是如果我们把“新疆”作为一个关键词,每次去更换,那么这个智能体的功能就相对固定了。

(2)工具协调

智能体可以通过插件、API接口等调用外部工具(比如搜索引擎、数据库)。突破大模型的能力边界。例如,智能体可以调用查询天气的API接口获取未来几天的天气情况,确定旅行过程中天气情况。

(3)记忆性

智能体的记忆性包括短期与长期记忆。

短期记忆。主要是当前对话的上下文(比如:新疆旅游),以维持交互的连贯性。

长期记忆。主要依托数据库来存储历史数据,支持跨场景服用。

(4)环境适用

智能体通过“通过—>分析—>决策—>执行”的闭环来应对动态变化。例如上面旅行过程中在预定机票的时候发现某个航班人数满了,那么可以立即找到备用航班信息。

4.智能体的工作原理

智能体的强大之处在于其模块化设计与协同机制,通过“感知—>分析—>决策—>执行”的一个闭环逻辑,将复杂的任务转化成可以落地的行动链条。

下文以旅行规划为例子,介绍智能体的工作流程。

(1)接受任务

当用户向智能体发出指令后,智能体接收这个任务。它会理解用户的需求(比如立即从青岛出发,前往新疆为期5天的旅行)

(2)规划任务

接受到任务后,智能体的规划单元开始工作,将这个任务拆分为多个子任务,以便更高效地完成目标。具体子任务可能包括:

  • 查询目的地计划日期的天气情况。
  • 查询计划日期内从青岛到新疆的高铁和航班信息。
  • 搜索新疆的热门景点。
  • 规划新疆的交通规划。

综上以上信息,生成详细的旅行计划。

(3)调用工具

在执行子任务的过程中,智能体会调用各种外部工具(例如天气插件、航班信息插件)来获取所需习信息。

(4)执行任务

当所有子任务都执行完成后,智能体的行动单元会整合这些信息,生成一个详细的旅行计划。计划的内容可能会包括:

  • 天气预报:列出计划日期的新疆的天气。
  • 交通安排:列出计划日期内从青岛到新疆的高铁和航班信息。
  • 热门景点:向用户推荐新疆热门的景点。
  • 行程安排:根据热门景点,规划室内交通计划。

(4)输出结果

智能体会将这个详细的旅行计划以文本形式输出。计划内容清晰、全面,涵盖了交通、行程安排,以及注意事项等,确保能轻松愉快的完成这次旅行。