HiReLC:基於分層強化學習的神經網路聯合剪枝與量化壓縮框架

本文提出了HiReLC,一種用於深度神經網路自動聯合量化與結構化剪枝的分層集成強化學習框架。該方法在兩個抽象層級上分解壓縮搜尋空間:低層代理(LLAs)獨立操作,為每個模組選擇涵蓋位寬、剪枝保留率、量化類型及粒度的多離散動作配置;高層代理(HLAs)則通過基於Fisher資訊的敏感性估計指導的集成投票,協調全域預算分配。為降低策略評估的計算成本,框架引入了迭代主動學習循環,結合輕量級MLP代理模型進行獎勵塑形,並在冷啟動階段使用logit-MSE代理,最終仍通過壓縮後微調進行嚴格評估。實驗表明,HiReLC在Vision Transformer和CNN基準上實現了5.99至6.72倍的參數儲存壓縮比,部分設定下準確率提升3.83%,其他設定下降0.55%至5.62%,驗證了分層策略分解和敏感性感知引導的有效性。

Sources