Nvidia开源Nemotron 3 Super:专为复杂Agent工作流设计的开放模型

Nvidia開源Nemotron 3 Super:120B三合一混合MoE架構,專為複雜Agent工作流設計,吞吐量提升5倍以上。

2026年3月11日,Nvidia發布Nemotron 3 Super,以寬鬆許可證完全開放權重和訓練方案。三合一混合MoE架構結合Mamba層(O(n)線性注意力)、Transformer層(複雜推理)和MoE路由(120B總參數中僅12B活化),吞吐量提升5倍以上。在10兆+Token上訓練,經過大量Agent環境的互動式RL,學會多步工作流的規劃、執行和迭代。