— AI DAILY

Nvidia開源Nemotron 3 Super：120B三合一混合MoE架構，專為複雜Agent工作流設計，吞吐量提升5倍以上。

2026年3月11日，Nvidia發布Nemotron 3 Super，以寬鬆許可證完全開放權重和訓練方案。三合一混合MoE架構結合Mamba層（O(n)線性注意力）、Transformer層（複雜推理）和MoE路由（120B總參數中僅12B活化），吞吐量提升5倍以上。在10兆+Token上訓練，經過大量Agent環境的互動式RL，學會多步工作流的規劃、執行和迭代。

Sources

Switas