DataCOPE:無需標註的Agent數據分析技能發現框架
本文提出DataCOPE,一種用於數據分析智能體(Agentic Data Analysis)的無監督驗證器引導技能發現框架。針對推理時技能增強中高質量監督信號稀缺且成功標準多樣的痛點,DataCOPE僅利用未標記的探索軌跡即可自動發現可複用的程序性知識。該框架通過迭代協調數據分析智能體、無監督驗證器和技能管理器,從軌跡中提取驗證信號以表徵相對質量或一致性。針對報告式分析,引入自適應清單驗證器,動態生成任務特定標準並評估覆蓋度;針對推理式分析,採用答案一致性驗證器,利用自一致性作為輔助信號。在Deep Data Research和DABStep基準上的實驗表明,DataCOPE在四種模型設置下平均將報告式和推理式任務的得分分別提升了9.71%和32.30%,顯著優於基線方法,為低成本提升數據分析Agent能力提供了新範式。