《从零开始构建智能体》:Datawhale 开源的系统性 AI Agent 教程
datawhalechina/hello-agents 是 Datawhale 社区发起的开源智能体学习教程,专注于 AI 原生(AI-Native)Agent 的设计与实现,而非流程驱动的低代码平台。它的目标是帮助开发者从 LLM 的使用者蜕变为智能体系统的构建者,补足当前社区中系统性、重实践 Agent 教程严重匮乏的空缺。目前已积累 24,074 Stars,日增 147 颗,在中文 AI 社区持续高热。
教程覆盖 16 个章节,从智能体基础理论(定义、历史、ReAct/Plan-and-Solve/Reflection 范式)出发,深入框架实战(AutoGen、AgentScope、LangGraph),再到上下文工程、记忆系统、MCP/A2A/ANP 通信协议、Agentic RL(从 SFT 到 GRPO 全流程)与性能评估,最终以智能旅行助手、赛博小镇等综合案例收尾。配套自研的 HelloAgents 框架基于 OpenAI 原生 API 从零实现,是不可多得的动手实践平台。
适合所有希望深入理解 AI Agent 底层原理并亲手构建多智能体系统的 Python 开发者与 AI 从业者。Datawhale 一贯的开源免费风格确保了极低的学习门槛,是 2025 年 Agent 元年不可错过的入门宝典。
《从零开始构建智能体》:Datawhale 开源的系统性 AI Agent 教程
背景:Agent 元年与教育空白
如果说 2023 年是「大模型爆发元年」,2024 年是「百模大战」的高峰,那么 2025 年无疑正式开启了「**Agent 元年**」。技术焦点已从比拼谁的底座模型更大、更强,转向一个更具实际价值的命题:**如何用 AI 真正做成一件事**。
这一背景下,AI Agent(智能体)技术成为最炙手可热的赛道。OpenAI 推出 Operator 和 Deep Research,Anthropic 发布 Computer Use,阿里的通义千问 Agent、百度文心的 Agent 框架相继落地。各大云厂商、独立软件开发商、AI 创业公司,几乎无一例外地将「Agent 化」列为 2025 年的首要战略方向。
然而,一个显著的矛盾出现了:**产业侧对 Agent 人才的需求急速上升,而系统性、重实践的 Agent 学习资源却严重稀缺**。现有的入门材料要么停留在概念介绍层面,要么只聚焦于某一个特定框架(如 LangChain、AutoGen),缺乏从原理到实战的完整脉络。
正是为了填补这一空白,Datawhale 社区发起了 **hello-agents** 项目——一本从零开始构建 AI 智能体的系统性开源教程。
项目热度:社区的用脚投票
hello-agents 在 GitHub 上的表现验证了市场需求的真实存在:项目发布后 GitHub Stars 迅速突破 **24,000**,日均新增约 **147 颗 Star**,稳居中文 AI 开源项目热度榜前列。
这一数据在开源社区中具有显著意义:相比大量需要大厂背书才能获得关注的 AI 项目,一个以教程为核心定位的社区项目能达到这样的热度,说明开发者群体对「真正能学会 Agent 构建」的需求是压倒性的。
课程架构:16 章五大模块的系统设计
hello-agents 采用 16 个章节、五大部分的系统性结构,从理论地基到毕业项目,构建了一条完整的学习路径。
第一部分:理论基础——打牢 Agent 的认知地基
第一章:初识智能体
从最基础的问题出发:什么是智能体?教程给出了一个清晰的工程化定义:能够感知环境、做出决策并采取行动以实现特定目标的 AI 系统。章节进一步梳理了 Agent 的四种核心类型(反应型、学习型、目标导向型、效用最大化型),以及当前主流的三大范式:ReAct、Plan-and-Solve、Reflection。
第二章:智能体发展史
从 1950 年代符号主义 AI 的规则引擎,到专家系统的兴衰,到强化学习赋能的 AlphaGo,再到 LLM 驱动的现代 Agent——理解这条演化路径,有助于开发者在面对具体问题时做出更准确的技术选型判断,而不是盲目追随最新框架。
第三章:大语言模型基础
扎实的 LLM 基础是 Agent 开发的前提。本章覆盖 Transformer 架构精要、提示工程(Prompt Engineering)的核心技巧,以及 GPT-4o、Claude 3.5、Gemini 1.5 Pro 等主流 LLM 的能力边界与适用场景对比。
第二部分:构建实践——动手写出第一个 Agent
第四章:三大经典范式手把手实现
- **ReAct(Reasoning + Acting)**:让模型在思考与行动之间交替迭代,是目前最成熟的 Agent 范式
- **Plan-and-Solve**:先规划完整执行计划,再逐步实施,适合长链路任务
- **Reflection**:自我评估与迭代改进机制,提升输出质量的关键
每个范式都配有完整的代码实现,从零开始,不依赖任何高层框架,帮助开发者真正理解底层逻辑。
第五章:低代码平台的使用与对比
面向想快速搭建原型的读者,详细评测 Coze、Dify、n8n 三大低代码 Agent 平台:
- Coze:字节跳动出品,Plugin 生态丰富,适合面向消费者的 Agent 应用
- Dify:开源优先,私有化部署能力强,企业级场景首选
- n8n:工作流自动化导向,与传统 SaaS 工具集成能力最强
第六章:主流框架实战
深入 AutoGen、AgentScope、LangGraph 三大框架:
- AutoGen(微软):多 Agent 对话与协作的标杆框架
- AgentScope(阿里):分布式 Agent 系统的中文生态代表
- LangGraph:基于图结构的复杂 Agent 工作流构建工具
第七章:从零构建 HelloAgents 框架
本章是教程的「毕业设计预备课」——直接基于 OpenAI 原生 API,不借助任何封装框架,从零构建一个功能完整的 HelloAgents 框架。这是真正理解 Agent 架构的必经之路。
第三部分:高级能力——让 Agent 更聪明、更可靠
第八章:记忆系统与 RAG
Agent 的记忆分为四个层次:工作记忆(上下文窗口)、情节记忆(对话历史)、语义记忆(向量数据库)、程序记忆(工具调用模式)。本章结合 RAG(检索增强生成)技术,系统讲解如何让 Agent 突破上下文窗口限制,拥有近乎无限的「长期记忆」。
第九章:上下文工程
提示工程(Prompt Engineering)只是第一步;上下文工程(Context Engineering)是下一个层次——如何在持续的多轮交互中动态管理上下文,确保 Agent 始终「记得」重要信息,同时不被无关内容干扰。
第十章:智能体通信协议深度解析
三大协议的全面梳理:
- **MCP(Model Context Protocol)**:Anthropic 发布的工具调用标准,正成为 Agent 生态的「USB 接口」
- **A2A(Agent-to-Agent)**:谷歌推动的 Agent 间通信协议,支持跨厂商的多 Agent 协作
- **ANP(Agent Network Protocol)**:面向去中心化 Agent 网络的协议标准
第十一章:Agentic RL
覆盖从 SFT(监督微调)到 GRPO(群组相对策略优化)的完整 LLM 训练流程,介绍如何用强化学习让 Agent 在与环境的交互中持续自我改进——这是目前最前沿的 Agent 能力提升路径之一。
第四部分:综合案例——真实项目驱动学习
案例一:智能旅行助手
综合运用 MCP 协议 + 多 Agent 协作,构建能够调用地图 API、机票查询、酒店预订等工具的旅行规划 Agent,覆盖真实项目中的工具集成、错误处理、多轮对话管理等核心工程问题。
案例二:自动化深度研究 Agent
复现 OpenAI Deep Research 的核心能力:自主搜索、阅读、综合多源信息,生成结构化研究报告。这是检验 Agent 规划与工具调用能力的标准测试场景。
案例三:赛博小镇
将 Agent 技术与游戏场景结合,构建一个多 Agent 社会模拟环境(灵感来自斯坦福 Smallville 论文),探索 Agent 的社会行为涌现现象——兼具学术趣味与工程实践价值。
第五部分:毕业设计
完整的多 Agent 应用开发项目,从需求分析、系统设计、Agent 拆分、工具集成,到测试与部署的全流程实战。
核心定位:AI 原生 Agent vs. 流程驱动 Agent
hello-agents 在立项之初就做出了一个重要的区分:
流程驱动 Agent(Dify / Coze / n8n 类):本质是用 AI 能力增强的工作流自动化工具,逻辑流转由人预先定义好的有向图控制,AI 只是其中的一个「步骤节点」。
AI 原生 Agent:真正以 AI 为驱动核心,具备自主规划、动态调整、记忆管理、工具调用的完整能力。它不需要人为预定义每一个分支,而是由 LLM 自主判断「下一步该做什么」。
hello-agents 专注于后者的系统性培养,帮助开发者穿透框架的表象,理解 AI-Native Agent 的底层机制——这一定位恰好切中了行业需求最高端、也是人才最稀缺的层次。
行业趋势:Agent 时代的核心竞争力
hello-agents 的走红是一个缩影,折射出更深层的行业转变:
AI 竞争的主战场从**模型层**转向**应用层**。当 GPT-4 级别的能力已近乎商品化,真正的差异化在于能否将 AI 能力有效嵌入真实业务流程。掌握 Agent 构建技术,意味着掌握了这场竞争的核心杠杆。
MCP 协议的广泛采纳正在构建 Agent 工具生态的「App Store 时代」——越来越多的 SaaS 工具开始原生支持 MCP 接口,Agent 调用外部能力的边界在迅速扩张。
随着 OpenAI、Anthropic、阿里、百度、Google 等主要厂商持续加码 Agent 赛道,**Agent 工程师**有望成为未来三年最稀缺的 AI 岗位之一。而 hello-agents 这样系统性的开源教程,或许正在孵化下一批能真正构建生产级 Agent 系统的工程师。