Skip to content

智能体概念与应用场景

课程视频预览

课程视频可点击上方图片访问。

欢迎来到 "AI Agents for Beginners"。本课程面向希望构建智能体的开发者,提供基础概念与实战示例。你也可以加入 Azure AI Discord Community,与全球学习者交流问题与经验。

开篇我们将从三个问题入手:

  • 智能体是什么?有哪些常见类型?
  • 哪些场景最适合智能体发挥价值?
  • 设计智能体解决方案时有哪些基础构件?

学习目标

完成本课后,你应能:

  • 理解智能体的核心概念,并区分其与传统 AI 方案的差异。
  • 判断何种场景适合引入智能体以提升效率。
  • 初步掌握构建智能体解决方案所需的关键组件。

智能体定义与类型

智能体是什么?

智能体是一个系统,通过为大型语言模型(LLM)提供工具访问知识补充,使其能够执行动作并与环境互动。

拆分来看:

  • 系统:智能体不是单一组件,而是由多个部分组成的系统:
    • 环境:智能体运行的场所,例如机票预订系统。
    • 传感器:环境会返回状态信息,智能体通过传感器获取并理解这些信息,如可用酒店和机票价格。
    • 执行器:智能体在掌握环境状态后决定采取的行动,例如为用户预订房间。

智能体系统示意

  • 大型语言模型:在智能体出现之前,自动化已存在。LLM 的优势在于理解与生成自然语言,便于读取环境反馈并制定策略。
  • 执行动作:在传统对话场景中,LLM 多数只能生成文本;在智能体系统内,LLM 通过调用工具完成真实任务。
  • 工具访问:可用工具由环境与开发者限定。例如旅行助手只能调用与行程相关的接口。
  • 记忆与知识:智能体可以在会话中维护短期记忆,也能通过外部系统获取长期知识,如用户偏好数据库。

常见智能体类型

以下表格继续以旅行助手为例,说明不同类型智能体的特征:

智能体类型描述示例
简单反射型智能体依据预设规则即时做出反应。根据邮件内容自动将投诉转给客服。
模型驱动反射型智能体基于环境模型及其变化做出决策。结合历史价格数据判断并优先推荐降幅明显的线路。
目标驱动智能体根据目标拆解并规划行动路径。综合考虑交通方式,为用户规划完整行程。
效用驱动智能体通过量化偏好,权衡方案优劣。比较花费与便利性,选出最优旅行方案。
自学习智能体持续吸收反馈,改进后续行为。根据行后评价调整未来的推荐策略。
分层智能体多层级协作,高层拆分任务,低层执行。退订行程时拆解为取消酒店、机票等子任务。
多智能体系统(MAS)多个智能体协作或竞争完成任务。协作模式:不同智能体负责酒店、航班、娱乐等子任务;竞争模式:多个智能体共享并争夺同一酒店资源。

何时使用智能体

我们将持续使用旅行助手场景帮助理解。适合引入智能体的典型情况包括:

智能体适用场景示意

  • 开放式问题:任务步骤无法完全硬编码,需要 LLM 自主规划。
  • 多步骤流程:必须跨多轮对话调用工具或信息,无法一次性完成。
  • 持续优化:智能体可通过环境或用户反馈不断提升表现。

关于可信智能体的更多考量将在 Lesson 06 讨论。

智能体解决方案的基础构件

智能体开发

设计智能体系统的第一步是定义工具、动作与行为。本课程示例主要使用 Azure AI Agent Service,它提供:

  • 可选择多种开放模型(如 OpenAI、Mistral、Llama)
  • 可调用授权数据服务(如 Tripadvisor)
  • 支持标准的 OpenAPI 3.0 工具扩展

智能体模式

智能体与 LLM 的交互依赖提示词。由于智能体具有半自主性,并非每次环境变化都能人工重写提示,因此需要使用 智能体模式 来组织多轮提示策略,以提升可扩展性。本课程后续章节将按照常见模式展开。

智能体框架

智能体框架帮助开发者以代码实现上述模式,通常提供模板、插件和协作工具,便于观测与调试。本课程将体验研究驱动的 AutoGen 框架,以及面向生产的 Semantic Kernel 智能体框架。

进一步交流

如需更多答疑或经验分享,可加入 Azure AI Foundry Discord

上一篇

00 课程环境准备

下一篇

02 智能体框架一览