Hugging Face Skills:让 Claude Code 和 Cursor 直接学会训练 AI 模型
Hugging Face 发布了官方 Skills 仓库,让 Claude Code、Cursor、OpenAI Codex、Gemini CLI 等主流编码 Agent 直接具备 AI/ML 全流程能力,Star 已狂涨 5k+。不再需要自己折腾训练环境,跟 AI 说一句话就能完成从数据准备到模型部署的整个链路。
目前提供 9 个 Skill,覆盖核心 ML 工作流:模型训练(SFT/DPO/GRPO/奖励建模,自动选硬件、估算成本)、数据集管理(初始化/更新/SQL 查询)、模型评估(跑完训练自动测评,结果写入模型卡片)、论文发布(arXiv 论文挂到 Hub,自动链接模型和数据集)、云端作业(在 HF 基础设施上跑 Python 脚本,不用管服务器)。还有 Gradio UI 构建、Trackio 实验追踪等辅助工具。
采用 Agent Skill 标准格式(每个 Skill 一个文件夹 + SKILL.md),兼容所有主流编码 Agent。安装后用自然语言调用——比如「用 HF 模型训练 Skill,估算跑 70B 模型需要多少显存」,Agent 自动加载对应指令和脚本完成任务。
项目背景
Hugging Face 发布了官方 Skills 仓库,让 Claude Code、Cursor、OpenAI Codex、Gemini CLI 等主流编码 Agent 直接具备完整的 AI/ML 工作流能力。Star 已狂涨 5k+,说明社区对「用自然语言操作 ML 全流程」的需求非常强烈。
以前训练模型需要自己搭环境、写训练脚本、配硬件参数、手动跑评测。现在安装一个 Skill,跟 AI 说句话就能搞定。
9 大 Skill 详解
1. 模型训练(hugging-face-model-trainer)
- 支持 SFT(监督微调)、DPO(直接偏好优化)、GRPO(群组相对策略优化)、奖励建模
- 基于 TRL 库,在 HF Jobs 基础设施上运行
- **自动硬件选择和成本估算**:告诉它模型大小,自动推荐 GPU 配置和费用
- 支持 GGUF 转换用于本地部署
- 内置 Trackio 监控和 Hub 持久化
2. 数据集管理(hugging-face-datasets)
- 初始化数据集仓库、定义配置和系统提示
- 流式更新行数据
- **SQL 查询和转换**:用 SQL 直接查询和操作数据集
3. 模型评估(hugging-face-evaluation)
- 提取 README 中的评测表格
- 从 Artificial Analysis API 导入评分
- 用 vLLM/lighteval 运行自定义评测
- **自动将评分结果写入模型卡片**,省去手动记录
4. 论文发布(hugging-face-paper-publisher)
- 将 arXiv 论文发布到 HF Hub
- 自动链接论文与关联的模型和数据集
- 支持认领作者身份
- 生成专业 Markdown 格式的研究文章
5. 云端作业(hugging-face-jobs)
- 在 HF 基础设施上执行 Python 脚本
- 管理定时任务
- 监控作业状态
- **完全不用管服务器**
6. CLI 操作(hugging-face-cli)
- 下载模型/数据集、上传文件、管理仓库
- 运行云计算作业
7. Gradio UI(gradio)
- 构建 Web UI 和 Demo
- 组件、事件监听、布局、聊天机器人
8. 实验追踪(hugging-face-trackio)
- Python API 记录训练指标
- CLI 查询历史指标
- 实时仪表盘同步到 HF Spaces
9. 工具构建(hugging-face-tool-builder)
- 构建可复用的 HF API 操作脚本
- 链式 API 调用和自动化重复任务
兼容性
采用 Agent Skill 标准格式(每个 Skill 一个文件夹 + SKILL.md + YAML frontmatter):
| 平台 | 安装方式 |
|------|---------|
| Claude Code | `/plugin marketplace add huggingface/skills` → `/plugin install <skill-name>@huggingface/skills` |
| OpenAI Codex | 复制到 `.agents/skills/` 目录,Codex 自动发现 |
| Gemini CLI | `gemini extensions install https://github.com/huggingface/skills.git --consent` |
| Cursor | 通过 `.cursor-plugin/plugin.json` 和 `.mcp.json` 安装 |
不支持 Skill 的 Agent 可以直接用 `agents/AGENTS.md` 作为 fallback。
使用示例
安装后用自然语言调用:
- 「用 HF 模型训练 Skill,估算跑 70B 模型需要多少显存」→ 完整方案 + 配置代码
- 「用 HF 评测 Skill,对最新 checkpoint 跑评测」→ 自动执行并写入结果
- 「用 HF 数据集 Skill,创建 few-shot 分类模板」→ 初始化数据集仓库
- 「用 HF 论文发布 Skill,把我的 arXiv 论文关联到模型」→ 自动索引和链接
Agent 自动加载对应的 SKILL.md 指令和辅助脚本完成任务。
意义
这是 AI 辅助机器学习的标准化基础设施。以前 ML 工程师需要精通命令行、了解硬件配置、手写训练脚本,现在这些都可以通过自然语言委托给编码 Agent。HF 作为 ML 生态的核心平台亲自下场做 Skills,等于给整个 AI Agent 生态提供了「ML 能力插件」。
协议:MIT | Star:5k+ | 维护:Hugging Face 官方