Hugging Face Skills:让 Claude Code 和 Cursor 直接学会训练 AI 模型

Hugging Face 发布了官方 Skills 仓库,让 Claude Code、Cursor、OpenAI Codex、Gemini CLI 等主流编码 Agent 直接具备 AI/ML 全流程能力,Star 已狂涨 5k+。不再需要自己折腾训练环境,跟 AI 说一句话就能完成从数据准备到模型部署的整个链路。

目前提供 9 个 Skill,覆盖核心 ML 工作流:模型训练(SFT/DPO/GRPO/奖励建模,自动选硬件、估算成本)、数据集管理(初始化/更新/SQL 查询)、模型评估(跑完训练自动测评,结果写入模型卡片)、论文发布(arXiv 论文挂到 Hub,自动链接模型和数据集)、云端作业(在 HF 基础设施上跑 Python 脚本,不用管服务器)。还有 Gradio UI 构建、Trackio 实验追踪等辅助工具。

采用 Agent Skill 标准格式(每个 Skill 一个文件夹 + SKILL.md),兼容所有主流编码 Agent。安装后用自然语言调用——比如「用 HF 模型训练 Skill,估算跑 70B 模型需要多少显存」,Agent 自动加载对应指令和脚本完成任务。

项目背景

Hugging Face 发布了官方 Skills 仓库,让 Claude Code、Cursor、OpenAI Codex、Gemini CLI 等主流编码 Agent 直接具备完整的 AI/ML 工作流能力。Star 已狂涨 5k+,说明社区对「用自然语言操作 ML 全流程」的需求非常强烈。

以前训练模型需要自己搭环境、写训练脚本、配硬件参数、手动跑评测。现在安装一个 Skill,跟 AI 说句话就能搞定。

9 大 Skill 详解

1. 模型训练(hugging-face-model-trainer)

  • 支持 SFT(监督微调)、DPO(直接偏好优化)、GRPO(群组相对策略优化)、奖励建模
  • 基于 TRL 库,在 HF Jobs 基础设施上运行
  • **自动硬件选择和成本估算**:告诉它模型大小,自动推荐 GPU 配置和费用
  • 支持 GGUF 转换用于本地部署
  • 内置 Trackio 监控和 Hub 持久化

2. 数据集管理(hugging-face-datasets)

  • 初始化数据集仓库、定义配置和系统提示
  • 流式更新行数据
  • **SQL 查询和转换**:用 SQL 直接查询和操作数据集

3. 模型评估(hugging-face-evaluation)

  • 提取 README 中的评测表格
  • 从 Artificial Analysis API 导入评分
  • 用 vLLM/lighteval 运行自定义评测
  • **自动将评分结果写入模型卡片**,省去手动记录

4. 论文发布(hugging-face-paper-publisher)

  • 将 arXiv 论文发布到 HF Hub
  • 自动链接论文与关联的模型和数据集
  • 支持认领作者身份
  • 生成专业 Markdown 格式的研究文章

5. 云端作业(hugging-face-jobs)

  • 在 HF 基础设施上执行 Python 脚本
  • 管理定时任务
  • 监控作业状态
  • **完全不用管服务器**

6. CLI 操作(hugging-face-cli)

  • 下载模型/数据集、上传文件、管理仓库
  • 运行云计算作业

7. Gradio UI(gradio)

  • 构建 Web UI 和 Demo
  • 组件、事件监听、布局、聊天机器人

8. 实验追踪(hugging-face-trackio)

  • Python API 记录训练指标
  • CLI 查询历史指标
  • 实时仪表盘同步到 HF Spaces

9. 工具构建(hugging-face-tool-builder)

  • 构建可复用的 HF API 操作脚本
  • 链式 API 调用和自动化重复任务

兼容性

采用 Agent Skill 标准格式(每个 Skill 一个文件夹 + SKILL.md + YAML frontmatter):

| 平台 | 安装方式 |

|------|---------|

| Claude Code | `/plugin marketplace add huggingface/skills` → `/plugin install <skill-name>@huggingface/skills` |

| OpenAI Codex | 复制到 `.agents/skills/` 目录,Codex 自动发现 |

| Gemini CLI | `gemini extensions install https://github.com/huggingface/skills.git --consent` |

| Cursor | 通过 `.cursor-plugin/plugin.json` 和 `.mcp.json` 安装 |

不支持 Skill 的 Agent 可以直接用 `agents/AGENTS.md` 作为 fallback。

使用示例

安装后用自然语言调用:

  • 「用 HF 模型训练 Skill,估算跑 70B 模型需要多少显存」→ 完整方案 + 配置代码
  • 「用 HF 评测 Skill,对最新 checkpoint 跑评测」→ 自动执行并写入结果
  • 「用 HF 数据集 Skill,创建 few-shot 分类模板」→ 初始化数据集仓库
  • 「用 HF 论文发布 Skill,把我的 arXiv 论文关联到模型」→ 自动索引和链接

Agent 自动加载对应的 SKILL.md 指令和辅助脚本完成任务。

意义

这是 AI 辅助机器学习的标准化基础设施。以前 ML 工程师需要精通命令行、了解硬件配置、手写训练脚本,现在这些都可以通过自然语言委托给编码 Agent。HF 作为 ML 生态的核心平台亲自下场做 Skills,等于给整个 AI Agent 生态提供了「ML 能力插件」。

协议:MIT | Star:5k+ | 维护:Hugging Face 官方