
NVIDIAはCESにて、「Vera」CPUと「Rubin」GPUを発表しました。
Vera
「Vera」は、Graceの後継となるスパコン向けCPUです。
GraceはArmの「Neoverce V2」というIPに基づいていましたが、このVeraは「Olympus」というNVIDIA独自カスタムのArmCPUとなっています。
OlympusはArmv9.2に基づいており、SMEやSVEのような行列演算の拡張命令が使えると見られます。また、FP8精度の演算をサポートしています。
コア数は88コアとなっており、Graceの72コアから増加しています。注目すべきは、NVIDIAが独自に開発したSMT技術である「NVIDIA Spatial Multi-threading」により、88コア176スレッドを実現しているという点です。ArmでSMTが効いている製品はそれほど多くなく、過去に「Cortex-A65AE」が対応していましたが圧倒的少数派です。
Grace同様LPDDRメモリを採用しますが、LPDDR5XのSOCAMMモジュールを採用し、最大1.5 TBのメモリを搭載することが可能です。メモリの詳細については語られていませんが、1.2 TB/sのメモリ帯域幅を有するとしています。
Rubin
「Rubin」はBlackwellの後継となるGPUアーキテクチャです。今回、「R100」(仮称)のような製品が登場したわけではなく、あくまでアーキテクチャが登場しただけとなります。Veraと合わせて今年後半に製品が投入される見込みです。
大規模なチップとなっており、トランジスタ数は最大3,360億基となっています。
NVIDIAのGPUアーキテクチャは伝統的に著名な数学者や科学者の名前に由来しますが、Rubinはアメリカの天文学者であるVera Cooper Rubin氏にちなんでいます。Vera CPUも同様です。
メモリにはHBM4を採用しており、22 TB/sのメモリ帯域幅を実現しています。GPUあたりの最大メモリ容量は288GBとなっています。
更に、第6世代のNVLinkを採用し、GPUあたりの帯域幅が3.6 TB/sとこれも2倍の性能となっています。
セキュリティ面でも改良が入っており、Confidential Computing、RSAエンジンが新設されています。
RubinはBlackwellと比較して数倍レベルで性能が向上しており、NVFP4での推論では50 PFLOPSとBlackwellの5倍の性能を実現しています。また、NVIDIAが提唱するAgentic AIを実現している推論モデルや、Mixture of Experts(MoE)モデルを利用した場合、推論におけるトークンあたりのコストが1/10に、学習におけるトークンあたりのコストが1/4になるとのことです。
Vera Rubin プラットフォーム
Vera Rubin プラットフォームは、Rubin GPUとVera CPUを中心に、NVLink 6 Switch、ConnectX-9 NIC、BlueField-4 DPU、Spectrum-6 Ethernet Switchで構成され、ソフトウェアやハードウェアを超えた究極の共同設計として一体化し、スーパーコンピュータを形成するとしています。
更に、Vera Rubn NVL72を8基スケールアウトした「DGX SuperPOD With DGX Vera Rubin NVL72」を発表しました。256基のVera CPU・512基のRubin GPUを1つのスパコンとして活用する事が可能です。
現在、Rubinはフル生産状態に入っており、今年後半以降に投入されるとのこと。採用が見込まれる企業として、AWSやAnthropic、Cisco、Dell、Microsoft、xAIなどが挙げられています。