《从零开始构建智能体》：Datawhale 开源的系统性 AI Agent 教程

datawhalechina/hello-agents 是 Datawhale 社区发起的开源智能体学习教程，专注于 AI 原生（AI-Native）Agent 的设计与实现，而非流程驱动的低代码平台。它的目标是帮助开发者从 LLM 的使用者蜕变为智能体系统的构建者，补足当前社区中系统性、重实践 Agent 教程严重匮乏的空缺。目前已积累 24,074 Stars，日增 147 颗，在中文 AI 社区持续高热。

教程覆盖 16 个章节，从智能体基础理论（定义、历史、ReAct/Plan-and-Solve/Reflection 范式）出发，深入框架实战（AutoGen、AgentScope、LangGraph），再到上下文工程、记忆系统、MCP/A2A/ANP 通信协议、Agentic RL（从 SFT 到 GRPO 全流程）与性能评估，最终以智能旅行助手、赛博小镇等综合案例收尾。配套自研的 HelloAgents 框架基于 OpenAI 原生 API 从零实现，是不可多得的动手实践平台。

适合所有希望深入理解 AI Agent 底层原理并亲手构建多智能体系统的 Python 开发者与 AI 从业者。Datawhale 一贯的开源免费风格确保了极低的学习门槛，是 2025 年 Agent 元年不可错过的入门宝典。

《从零开始构建智能体》：Datawhale 开源的系统性 AI Agent 教程

背景：Agent 元年与教育空白

如果说 2023 年是「大模型爆发元年」，2024 年是「百模大战」的高峰，那么 2025 年无疑正式开启了「**Agent 元年**」。技术焦点已从比拼谁的底座模型更大、更强，转向一个更具实际价值的命题：**如何用 AI 真正做成一件事**。

这一背景下，AI Agent（智能体）技术成为最炙手可热的赛道。OpenAI 推出 Operator 和 Deep Research，Anthropic 发布 Computer Use，阿里的通义千问 Agent、百度文心的 Agent 框架相继落地。各大云厂商、独立软件开发商、AI 创业公司，几乎无一例外地将「Agent 化」列为 2025 年的首要战略方向。

然而，一个显著的矛盾出现了：**产业侧对 Agent 人才的需求急速上升，而系统性、重实践的 Agent 学习资源却严重稀缺**。现有的入门材料要么停留在概念介绍层面，要么只聚焦于某一个特定框架（如 LangChain、AutoGen），缺乏从原理到实战的完整脉络。

正是为了填补这一空白，Datawhale 社区发起了 **hello-agents** 项目——一本从零开始构建 AI 智能体的系统性开源教程。

项目热度：社区的用脚投票

hello-agents 在 GitHub 上的表现验证了市场需求的真实存在：项目发布后 GitHub Stars 迅速突破 **24,000**，日均新增约 **147 颗 Star**，稳居中文 AI 开源项目热度榜前列。

这一数据在开源社区中具有显著意义：相比大量需要大厂背书才能获得关注的 AI 项目，一个以教程为核心定位的社区项目能达到这样的热度，说明开发者群体对「真正能学会 Agent 构建」的需求是压倒性的。

课程架构：16 章五大模块的系统设计

hello-agents 采用 16 个章节、五大部分的系统性结构，从理论地基到毕业项目，构建了一条完整的学习路径。

第一部分：理论基础——打牢 Agent 的认知地基

第一章：初识智能体

从最基础的问题出发：什么是智能体？教程给出了一个清晰的工程化定义：能够感知环境、做出决策并采取行动以实现特定目标的 AI 系统。章节进一步梳理了 Agent 的四种核心类型（反应型、学习型、目标导向型、效用最大化型），以及当前主流的三大范式：ReAct、Plan-and-Solve、Reflection。

第二章：智能体发展史

从 1950 年代符号主义 AI 的规则引擎，到专家系统的兴衰，到强化学习赋能的 AlphaGo，再到 LLM 驱动的现代 Agent——理解这条演化路径，有助于开发者在面对具体问题时做出更准确的技术选型判断，而不是盲目追随最新框架。

第三章：大语言模型基础

扎实的 LLM 基础是 Agent 开发的前提。本章覆盖 Transformer 架构精要、提示工程（Prompt Engineering）的核心技巧，以及 GPT-4o、Claude 3.5、Gemini 1.5 Pro 等主流 LLM 的能力边界与适用场景对比。

第二部分：构建实践——动手写出第一个 Agent

第四章：三大经典范式手把手实现

**ReAct（Reasoning + Acting）**：让模型在思考与行动之间交替迭代，是目前最成熟的 Agent 范式
**Plan-and-Solve**：先规划完整执行计划，再逐步实施，适合长链路任务
**Reflection**：自我评估与迭代改进机制，提升输出质量的关键

每个范式都配有完整的代码实现，从零开始，不依赖任何高层框架，帮助开发者真正理解底层逻辑。

第五章：低代码平台的使用与对比

面向想快速搭建原型的读者，详细评测 Coze、Dify、n8n 三大低代码 Agent 平台：

Coze：字节跳动出品，Plugin 生态丰富，适合面向消费者的 Agent 应用
Dify：开源优先，私有化部署能力强，企业级场景首选
n8n：工作流自动化导向，与传统 SaaS 工具集成能力最强

第六章：主流框架实战

深入 AutoGen、AgentScope、LangGraph 三大框架：

AutoGen（微软）：多 Agent 对话与协作的标杆框架
AgentScope（阿里）：分布式 Agent 系统的中文生态代表
LangGraph：基于图结构的复杂 Agent 工作流构建工具

第七章：从零构建 HelloAgents 框架

本章是教程的「毕业设计预备课」——直接基于 OpenAI 原生 API，不借助任何封装框架，从零构建一个功能完整的 HelloAgents 框架。这是真正理解 Agent 架构的必经之路。

第三部分：高级能力——让 Agent 更聪明、更可靠

第八章：记忆系统与 RAG

Agent 的记忆分为四个层次：工作记忆（上下文窗口）、情节记忆（对话历史）、语义记忆（向量数据库）、程序记忆（工具调用模式）。本章结合 RAG（检索增强生成）技术，系统讲解如何让 Agent 突破上下文窗口限制，拥有近乎无限的「长期记忆」。

第九章：上下文工程

提示工程（Prompt Engineering）只是第一步；上下文工程（Context Engineering）是下一个层次——如何在持续的多轮交互中动态管理上下文，确保 Agent 始终「记得」重要信息，同时不被无关内容干扰。

第十章：智能体通信协议深度解析

三大协议的全面梳理：

**MCP（Model Context Protocol）**：Anthropic 发布的工具调用标准，正成为 Agent 生态的「USB 接口」
**A2A（Agent-to-Agent）**：谷歌推动的 Agent 间通信协议，支持跨厂商的多 Agent 协作
**ANP（Agent Network Protocol）**：面向去中心化 Agent 网络的协议标准

第十一章：Agentic RL

覆盖从 SFT（监督微调）到 GRPO（群组相对策略优化）的完整 LLM 训练流程，介绍如何用强化学习让 Agent 在与环境的交互中持续自我改进——这是目前最前沿的 Agent 能力提升路径之一。

第四部分：综合案例——真实项目驱动学习

案例一：智能旅行助手

综合运用 MCP 协议 + 多 Agent 协作，构建能够调用地图 API、机票查询、酒店预订等工具的旅行规划 Agent，覆盖真实项目中的工具集成、错误处理、多轮对话管理等核心工程问题。

案例二：自动化深度研究 Agent

复现 OpenAI Deep Research 的核心能力：自主搜索、阅读、综合多源信息，生成结构化研究报告。这是检验 Agent 规划与工具调用能力的标准测试场景。

案例三：赛博小镇

将 Agent 技术与游戏场景结合，构建一个多 Agent 社会模拟环境（灵感来自斯坦福 Smallville 论文），探索 Agent 的社会行为涌现现象——兼具学术趣味与工程实践价值。

第五部分：毕业设计

完整的多 Agent 应用开发项目，从需求分析、系统设计、Agent 拆分、工具集成，到测试与部署的全流程实战。

核心定位：AI 原生 Agent vs. 流程驱动 Agent

hello-agents 在立项之初就做出了一个重要的区分：

流程驱动 Agent（Dify / Coze / n8n 类）：本质是用 AI 能力增强的工作流自动化工具，逻辑流转由人预先定义好的有向图控制，AI 只是其中的一个「步骤节点」。

AI 原生 Agent：真正以 AI 为驱动核心，具备自主规划、动态调整、记忆管理、工具调用的完整能力。它不需要人为预定义每一个分支，而是由 LLM 自主判断「下一步该做什么」。

hello-agents 专注于后者的系统性培养，帮助开发者穿透框架的表象，理解 AI-Native Agent 的底层机制——这一定位恰好切中了行业需求最高端、也是人才最稀缺的层次。

行业趋势：Agent 时代的核心竞争力

hello-agents 的走红是一个缩影，折射出更深层的行业转变：

AI 竞争的主战场从**模型层**转向**应用层**。当 GPT-4 级别的能力已近乎商品化，真正的差异化在于能否将 AI 能力有效嵌入真实业务流程。掌握 Agent 构建技术，意味着掌握了这场竞争的核心杠杆。

MCP 协议的广泛采纳正在构建 Agent 工具生态的「App Store 时代」——越来越多的 SaaS 工具开始原生支持 MCP 接口，Agent 调用外部能力的边界在迅速扩张。

随着 OpenAI、Anthropic、阿里、百度、Google 等主要厂商持续加码 Agent 赛道，**Agent 工程师**有望成为未来三年最稀缺的 AI 岗位之一。而 hello-agents 这样系统性的开源教程，或许正在孵化下一批能真正构建生产级 Agent 系统的工程师。