NVIDIA Nemotron 3 Nano:320億參數MoE模型僅激活3.6B,百萬token上下文窗口
NVIDIA發布Nemotron 3 Nano,320億參數MoE模型運行時僅激活3.6B,100萬token上下文窗口,專為高效智能體任務設計。
NVIDIA於2026年3月發布Nemotron 3 Nano,採用MoE架構總參數320億但推理時僅激活3.6億——成本降低約90%。100萬token超長上下文窗口。針對工具呼叫、結構化輸出、多步驟推理等智能體任務優化。在函數呼叫基準測試中性能接近GPT-4o,可在消費級GPU上運行。