Quelles sont les spécifications clés du Vera Rubin NVL72 ?

72 GPU Rubin + 36 CPU Vera en rack refroidi par liquide ; NVLink 6 : 3,6 To/s par GPU (260 To/s rack) ; 75 To de mémoire rapide totale (20,7 To HBM4 + 54 To LPDDR5X) ; HBM : 1,6 Po/s ; Inférence : 3,6 EFLOPS (10x perf/watt vs Blackwell, 1/10 coût/token) ; Entraînement : 2,5 EFLOPS (MoE avec 1/4 des GPU Blackwell).

Qu'est-ce que le Vera CPU ?

Le Vera CPU est conçu spécifiquement pour l'IA agentique et l'apprentissage par renforcement—pas un CPU serveur général. Ses 88 cœurs Olympus à 1,2 To/s de bande passante et 1,8 To/s NVLink-C2C avec les GPU Rubin le rendent 50% plus rapide et 2x plus efficace que les CPU rack traditionnels pour les charges de travail IA.

Quand Vera Rubin sera-t-il disponible ?

NVIDIA a confirmé que Vera Rubin est en pleine production et sera livré aux clients au S2 2026. Les premiers destinataires sont les grands fournisseurs de cloud. La tarification des racks est attendue dans la gamme de plusieurs millions de dollars.

Vera Rubin Platform Deep Dive: NVIDIA's Supercompute Foundation for Agentic AI

NVIDIA lance la plateforme Vera Rubin au GTC 2026, infrastructure de supercalcul pour l'ère de l'IA agentique. Intégrant les nouveaux CPU Vera et GPU Rubin en configurations NVL72 et HGX NVL8, elle couvre tout le cycle de vie de l'IA, du pré-entraînement à l'inférence agentique en temps réel. Le module spatial Vera Rubin étend le calcul IA aux centres de données orbitaux.

Vera Rubin Platform

en détail : La base supercomputing de NVIDIA pour l'ère Agentic AI La plateforme Vera Rubin de NVIDIA, entièrement détaillée au GTC 2026, est conçue spécifiquement pour l'IA agentique—pas une simple mise à niveau de génération. #

Spécifications

techniques complètes **Vera CPU :** 88 cœurs "Olympus" personnalisés ; 227 milliards de transistors ; LPDDR5X jusqu'à **1,5 To / 1,2 To/s** ; 50% plus rapide + 2x plus efficace que les CPU rack traditionnels ; NVLink-C2C : **1,8 To/s** (7x PCIe Gen 6) **Vera Rubin NVL72 :** 72 GPU Rubin + 36 CPU Vera ; NVLink 6 : **3,6 To/s par GPU**, **260 To/s rack** ; Mémoire totale rapide : **75 To** ; HBM : **1,6 Po/s** ; Inférence : **3,6 EFLOPS** (10x perf/watt vs Blackwell, 1/10 coût/token) ; Intègre le **NVIDIA Groq 3 LPU** #

L'intégration du Groq 3 LPU Groq Inc.

(pas xAI) est connu pour l'inférence ultra-faible latence. L'intégration dans le NVL72 permet inférence haute densité (GPU) + inférence ultra-faible latence (LPU)—combinaison critique pour les agents IA. #

Pourquoi Vera

Rubin est différent de Blackwell Blackwell : optimisé pour l'entraînement parallèle massif. Vera Rubin : optimisé pour **l'inférence IA agentique continue**. Disponibilité : 2ème semestre 2026. #

Analyse

approfondie et perspectives industrielles Dans une perspective plus large, cette evolution illustre la tendance acceleree de la transition de la technologie IA des laboratoires vers les applications industrielles. Les analystes du secteur s accordent a dire que 2026 sera une annee charniere pour la commercialisation de l IA. Sur le plan technique, l efficacite d inference des grands modeles continue de s ameliorer tandis que les couts de deploiement diminuent, permettant a davantage de PME d acceder aux capacites avancees de l IA. Cependant, la proliferation rapide de l IA apporte egalement de nouveaux defis: complexite croissante de la protection des donnees personnelles, demandes accrues de transparence des decisions de l IA et difficultes de coordination de la gouvernance transfrontaliere de l IA. Les autorites reglementaires de plusieurs pays surveillent de pres ces evolutions, tentant d equilibrer promotion de l innovation et prevention des risques.