NVIDIA新GPU架构,1TB HBM4e内存能颠覆性能极限?
9
0

NVIDIA发布下一代架构“Feynman”及多款产品规划
NVIDIA Blackwell架构虽然在加速卡、游戏卡上都遭遇诸多波折,但这并不影响NVIDIA对于未来的宏伟规划。近日,NVIDIA公布了下一代Rubin架构的具体产品规划,并首次宣布了再下一代架构“Feynman”。
Feynman架构的背景及意义
Feynman架构以20世纪最伟大的物理学家之一,诺贝尔物理学奖获得者理查德·费曼命名。费曼在量子电动力学、量子计算、纳米技术等领域都有开创性的成就,并撰写了《费曼物理学讲义》、提出了“费曼学习法”。1986年挑战者号航天飞机爆炸失事的根本原因也是他查明的。
Blackwell Ultra NV72:高性能服务器产品
NVIDIA这次一共宣布了三款产品,首先是“Blackwell Ultra NV72”。这款服务器预计在今年下半年发布,每个节点配备两颗升级版的Blackwell GPU、一颗Grace CPU,搭配多达288GB HBM3e高带宽内存,Dense FP4性能高达15PFlops(每秒1.5亿亿次)。
整台服务器一共72个节点,也就是144颗GPU、72颗CPU、20TB HBM3e、40TB DDR5内存,比上代增加50%,CX8互连带宽14.4TB/s,增加100%。整机的Dense FP4推理性高达1.1EFlops(每秒110亿亿次),FP8训练性能高达0.36EFlps(36亿亿次),还有新的注意力指令。
Rubin架构:全新服务器产品Vera Rubin NV144
2026年下半年,我们将迎来全新的Rubin架构,首发服务器产品为“Vera Rubin NV144”。每个节点两颗Rubin GPU搭配一颗全新的Vera CPU。其中,Rubin GPU搭配288GB容量的下一代HBM4内存,FP4浮点性能跃升到50PFlops(每秒5亿亿次)。
Vera CPU则包含88个自研Arm架构核心,首次支持多线程而达到176线程,彼此之间通过1.8TB/s带宽的NVLink-C2C总线连接在一起。整台服务器一共144个节点,也就是288颗GPU、144颗CPU、41.5TB HBM4内存(带宽13TB/s),还有75TB的系统内存。FP4推理性能来到3.6EFlops(每秒360亿亿次),FP8训练性能则是1.2EFlops(每秒120亿亿次)。
Rubin Ultra NV576:升级版Rubin架构产品
2027年下半年,我们将看到升级版的“Rubin Ultra NV576”。每个节点包含四颗Rubin GPU、一颗Vera GPU,并升级1TB HBM4e内存,FP4浮点性能高达100PFlops(10亿亿次)。
整机一共多达576个节点,也就是拥有2304颗Rubin GPU、576颗Vera CPU、576TB HBM5e(带宽4.6PB/s),还有365TB系统内存。NVLink互连总线升级到第七代NVLink7,带宽惊人的1.5PB/s,另外CX9总线带宽115.2TB/s。FP4推理性能高达15EFlops(每秒1500亿亿次),FP8训练性能5EFlops(每秒500亿亿次)。
Feynman架构:2028年首次登场
至于新的Feynman架构,将在2028年首次登场,搭配下一代HBM内存(HBM5?),但具体细节暂未披露。