Moebius:以0.2B參數實現10B級性能的輕量化圖像修復框架

針對十億級工業基礎模型在圖像修復任務中計算成本過高、難以部署的問題,本文提出了一種名為Moebius的高效輕量級修復框架。該研究旨在解決極端結構壓縮導致的表示瓶頸,通過系統重構擴散主干網絡,引入了局部-λ混合交互(LλMI)模塊。該模塊由局部-λ和交互-λ組成,能夠將空間上下文和全局語義先驗壓縮為固定大小的線性矩陣,在大幅減少參數的同時保留複雜的潛在交互。此外,為了充分釋放緊湊架構的表示能力,研究結合了一種自適應多粒度蒸餾策略,在潛在空間內動態平衡多種基於梯度的損失,實現高保真對齊。實驗表明,Moebius僅使用不到2%的參數(0.22B對比11.9B),推理速度提升超過15倍,在自然和肖像基準測試中性能媲美甚至超越FLUX.1-Fill-Dev,樹立了高保真修復的新效率標準。

Sources