匹配原則:面向干擾魯棒表徵學習的損失函數幾何理論

本文提出「匹配原則」,將魯棒性、域適應、光度不變性等分散問題統一為估計標籤保持部署干擾協方差的單一統計問題。理論證明在線性高斯模型下存在閉式最優解,並揭示正則化器必須覆蓋該協方差範圍。引入無標籤探針TDI評估嵌入敏感性,在13個預註冊實驗中驗證了理論預測的幾何排序,7B模型實驗顯示匹配正則化提升了選擇性誠實性並保留風格特徵,為魯棒學習提供了可證偽的統一框架。