Hugging Face Skills:讓 Claude Code 和 Cursor 直接學會訓練 AI 模型
Hugging Face 發佈了官方 Skills 倉庫,讓 Claude Code、Cursor、OpenAI Codex、Gemini CLI 等主流編碼 Agent 直接具備 AI/ML 全流程能力,Star 已狂漲 5k+。不再需要自己折騰訓練環境,跟 AI 說一句話就能完成從數據準備到模型部署的整個鏈路。
目前提供 9 個 Skill,覆蓋核心 ML 工作流:模型訓練(SFT/DPO/GRPO/獎勵建模,自動選硬件、估算成本)、數據集管理(初始化/更新/SQL 查詢)、模型評估(跑完訓練自動測評,結果寫入模型卡片)、論文發佈(arXiv 論文掛到 Hub,自動鏈接模型和數據集)、雲端作業(在 HF 基礎設施上跑 Python 腳本,不用管服務器)。還有 Gradio UI 構建、Trackio 實驗追蹤等輔助工具。
採用 Agent Skill 標準格式(每個 Skill 一個文件夾 + SKILL.md),兼容所有主流編碼 Agent。安裝後用自然語言調用——比如「用 HF 模型訓練 Skill,估算跑 70B 模型需要多少顯存」,Agent 自動加載對應指令和腳本完成任務。
项目背景
Hugging Face 發布了官方 Skills 仓库,让 Claude Code、Cursor、OpenAI Codex、Gemini CLI 等主流编码 Agent 直接具备完整的 AI/ML 工作流能力。Star 已狂涨 5k+,说明社区對「用自然语言操作 ML 全流程」的需求非常强烈。
以前训练模型需要自己搭環境、写训练脚本、配硬件参數、手動跑评測。現在安装一个 Skill,跟 AI 说句话就能搞定。
9 大 Skill 详解
1. 模型训练(hugging-face-model-trainer)
- 支持 SFT(监督微调)、DPO(直接偏好优化)、GRPO(群组相對策略优化)、奖励建模
- 基于 TRL 库,在 HF Jobs 基础設施上運行
- **自動硬件选择和成本估算**:告诉它模型大小,自動推荐 GPU 配置和费用
- 支持 GGUF 转换用于本地部署
- 内置 Trackio 监控和 Hub 持久化
2. 數據集管理(hugging-face-datasets)
- 初始化數據集仓库、定義配置和系統提示
- 流式更新行數據
- **SQL 查询和转换**:用 SQL 直接查询和操作數據集
3. 模型评估(hugging-face-evaluation)
- 提取 README 中的评測表格
- 從 Artificial Analysis API 导入评分
- 用 vLLM/lighteval 運行自定義评測
- **自動将评分结果写入模型卡片**,省去手動记录
4. 论文發布(hugging-face-paper-publisher)
- 将 arXiv 论文發布到 HF Hub
- 自動链接论文與關联的模型和數據集
- 支持認领作者身份
- 生成專業 Markdown 格式的研究文章
5. 云端作業(hugging-face-jobs)
- 在 HF 基础設施上执行 Python 脚本
- 管理定时任务
- 监控作業状态
- **完全不用管服务器**
6. CLI 操作(hugging-face-cli)
- 下载模型/數據集、上传文件、管理仓库
- 運行云計算作業
7. Gradio UI(gradio)
- 構建 Web UI 和 Demo
- 组件、事件监听、布局、聊天機器人
8. 實驗追踪(hugging-face-trackio)
- Python API 记录训练指標
- CLI 查询历史指標
- 實时仪表盘同步到 HF Spaces
9. 工具構建(hugging-face-tool-builder)
- 構建可复用的 HF API 操作脚本
- 链式 API 调用和自動化重复任务
兼容性
采用 Agent Skill 標準格式(每个 Skill 一个文件夹 + SKILL.md + YAML frontmatter):
| 平台 | 安装方式 |
|------|---------|
| Claude Code | `/plugin marketplace add huggingface/skills` → `/plugin install <skill-name>@huggingface/skills` |
| OpenAI Codex | 复制到 `.agents/skills/` 目录,Codex 自動發現 |
| Gemini CLI | `gemini extensions install https://github.com/huggingface/skills.git --consent` |
| Cursor | 通過 `.cursor-plugin/plugin.json` 和 `.mcp.json` 安装 |
不支持 Skill 的 Agent 可以直接用 `agents/AGENTS.md` 作為 fallback。
使用示例
安装後用自然语言调用:
- 「用 HF 模型训练 Skill,估算跑 70B 模型需要多少显存」→ 完整方案 + 配置代码
- 「用 HF 评測 Skill,對最新 checkpoint 跑评測」→ 自動执行並写入结果
- 「用 HF 數據集 Skill,創建 few-shot 分类模板」→ 初始化數據集仓库
- 「用 HF 论文發布 Skill,把我的 arXiv 论文關联到模型」→ 自動索引和链接
Agent 自動加载對應的 SKILL.md 指令和辅助脚本完成任务。
意義
這是 AI 辅助機器學習的標準化基础設施。以前 ML 工程师需要精通命令行、了解硬件配置、手写训练脚本,現在這些都可以通過自然语言委托给编码 Agent。HF 作為 ML 生态的核心平台亲自下場做 Skills,等于给整个 AI Agent 生态提供了「ML 能力插件」。
协议:MIT | Star:5k+ | 维護:Hugging Face 官方