DiffusionGemma 推理透明度深度解析:從變量到算法的透明性評估
本文深入探討擴散模型 DiffusionGemma 的推理透明度問題,旨在理解其決策機制並緩解對齊風險。研究將透明度拆解為變量透明度與算法透明度兩個維度。儘管 DiffusionGemma 在連續潛在空間中進行大量計算,初始不透明串行深度約為自回歸模型 Gemma 4 的 28.6 倍,但通過引入可解釋的令牌瓶頸層,成功將去噪步驟間的信息流映射為可追蹤路徑,使不透明串行深度降至 1.1 倍且未損害下游性能。在算法透明度方面,擴散模型每步可改變所有令牌預測,其分佈式算法實現遠比自回歸模型複雜。研究通過案例揭示非時序推理、令牌塗抹與序列塗抹等新穎現象,證實 DiffusionGemma 在可監控性上與 Gemma 4 相當,為構建更安全、透明的擴散推理系統開闢新路徑。