英伟达创始人兼CEO黄仁勋在GTC 2026大会上宣布,Vera Rubin平台已全面量产。该平台整合了七款全新芯片,构成一个专为AI智能体设计的超级计算机。
核心性能
核心机架Vera Rubin NVL72集成了72颗Rubin GPU和36颗Vera CPU,通过NVLink 6互连。
- 相比上一代Blackwell平台,训练大型混合专家模型所需GPU数量减少75%。
- 每瓦推理吞吐量最高可达Blackwell的10倍。
- 每令牌成本降至十分之一。
五大机架系统
平台由五类机架系统构成完整的AI工厂基础设施:
- Vera Rubin NVL72 GPU机架
- Vera CPU机架:集成256颗Vera CPU,效率是传统CPU的2倍,速度提升50%。
- Groq 3 LPX推理加速机架
- BlueField-4 STX存储机架:专为AI Agent键值缓存设计,推理吞吐量最高提升5倍。
- Spectrum-6 SPX以太网机架
能耗管理
英伟达同步发布DSX平台优化能耗:
- DSX Max-Q:可在固定电力限额内多部署30%的AI基础设施。
- DSX Flex:可激活此前无法利用的100吉瓦闲置电网容量。
生态与合作
AWS、谷歌云、微软Azure、甲骨文云等主流云服务商,以及思科、戴尔、联想等系统厂商均计划在今年下半年推出Vera Rubin产品。Anthropic、Meta、Mistral AI和OpenAI已明确将使用该平台训练更大模型。
黄仁勋预测,Blackwell和Vera Rubin系统在2025至2027年的合计订单将至少达到1万亿美元。