Hugging Face Skills:讓 Claude Code 和 Cursor 直接學會訓練 AI 模型

Hugging Face 發佈了官方 Skills 倉庫,讓 Claude Code、Cursor、OpenAI Codex、Gemini CLI 等主流編碼 Agent 直接具備 AI/ML 全流程能力,Star 已狂漲 5k+。不再需要自己折騰訓練環境,跟 AI 說一句話就能完成從數據準備到模型部署的整個鏈路。

目前提供 9 個 Skill,覆蓋核心 ML 工作流:模型訓練(SFT/DPO/GRPO/獎勵建模,自動選硬件、估算成本)、數據集管理(初始化/更新/SQL 查詢)、模型評估(跑完訓練自動測評,結果寫入模型卡片)、論文發佈(arXiv 論文掛到 Hub,自動鏈接模型和數據集)、雲端作業(在 HF 基礎設施上跑 Python 腳本,不用管服務器)。還有 Gradio UI 構建、Trackio 實驗追蹤等輔助工具。

採用 Agent Skill 標準格式(每個 Skill 一個文件夾 + SKILL.md),兼容所有主流編碼 Agent。安裝後用自然語言調用——比如「用 HF 模型訓練 Skill,估算跑 70B 模型需要多少顯存」,Agent 自動加載對應指令和腳本完成任務。

项目背景

Hugging Face 發布了官方 Skills 仓库,让 Claude Code、Cursor、OpenAI Codex、Gemini CLI 等主流编码 Agent 直接具备完整的 AI/ML 工作流能力。Star 已狂涨 5k+,说明社区對「用自然语言操作 ML 全流程」的需求非常强烈。

以前训练模型需要自己搭環境、写训练脚本、配硬件参數、手動跑评測。現在安装一个 Skill,跟 AI 说句话就能搞定。

9 大 Skill 详解

1. 模型训练(hugging-face-model-trainer)

  • 支持 SFT(监督微调)、DPO(直接偏好优化)、GRPO(群组相對策略优化)、奖励建模
  • 基于 TRL 库,在 HF Jobs 基础設施上運行
  • **自動硬件选择和成本估算**:告诉它模型大小,自動推荐 GPU 配置和费用
  • 支持 GGUF 转换用于本地部署
  • 内置 Trackio 监控和 Hub 持久化

2. 數據集管理(hugging-face-datasets)

  • 初始化數據集仓库、定義配置和系統提示
  • 流式更新行數據
  • **SQL 查询和转换**:用 SQL 直接查询和操作數據集

3. 模型评估(hugging-face-evaluation)

  • 提取 README 中的评測表格
  • 從 Artificial Analysis API 导入评分
  • 用 vLLM/lighteval 運行自定義评測
  • **自動将评分结果写入模型卡片**,省去手動记录

4. 论文發布(hugging-face-paper-publisher)

  • 将 arXiv 论文發布到 HF Hub
  • 自動链接论文與關联的模型和數據集
  • 支持認领作者身份
  • 生成專業 Markdown 格式的研究文章

5. 云端作業(hugging-face-jobs)

  • 在 HF 基础設施上执行 Python 脚本
  • 管理定时任务
  • 监控作業状态
  • **完全不用管服务器**

6. CLI 操作(hugging-face-cli)

  • 下载模型/數據集、上传文件、管理仓库
  • 運行云計算作業

7. Gradio UI(gradio)

  • 構建 Web UI 和 Demo
  • 组件、事件监听、布局、聊天機器人

8. 實驗追踪(hugging-face-trackio)

  • Python API 记录训练指標
  • CLI 查询历史指標
  • 實时仪表盘同步到 HF Spaces

9. 工具構建(hugging-face-tool-builder)

  • 構建可复用的 HF API 操作脚本
  • 链式 API 调用和自動化重复任务

兼容性

采用 Agent Skill 標準格式(每个 Skill 一个文件夹 + SKILL.md + YAML frontmatter):

| 平台 | 安装方式 |

|------|---------|

| Claude Code | `/plugin marketplace add huggingface/skills` → `/plugin install <skill-name>@huggingface/skills` |

| OpenAI Codex | 复制到 `.agents/skills/` 目录,Codex 自動發現 |

| Gemini CLI | `gemini extensions install https://github.com/huggingface/skills.git --consent` |

| Cursor | 通過 `.cursor-plugin/plugin.json` 和 `.mcp.json` 安装 |

不支持 Skill 的 Agent 可以直接用 `agents/AGENTS.md` 作為 fallback。

使用示例

安装後用自然语言调用:

  • 「用 HF 模型训练 Skill,估算跑 70B 模型需要多少显存」→ 完整方案 + 配置代码
  • 「用 HF 评測 Skill,對最新 checkpoint 跑评測」→ 自動执行並写入结果
  • 「用 HF 數據集 Skill,創建 few-shot 分类模板」→ 初始化數據集仓库
  • 「用 HF 论文發布 Skill,把我的 arXiv 论文關联到模型」→ 自動索引和链接

Agent 自動加载對應的 SKILL.md 指令和辅助脚本完成任务。

意義

這是 AI 辅助機器學習的標準化基础設施。以前 ML 工程师需要精通命令行、了解硬件配置、手写训练脚本,現在這些都可以通過自然语言委托给编码 Agent。HF 作為 ML 生态的核心平台亲自下場做 Skills,等于给整个 AI Agent 生态提供了「ML 能力插件」。

协议:MIT | Star:5k+ | 维護:Hugging Face 官方