NVIDIAは、米国の中国に対する輸出制限政策に対応する新しい「GeForce RTX 4090D」を正式に発表しました*1。
輸出規制
NVIDIA製のチップは、非常に高い性能を誇っています。特にAIや並列演算については世界随一の性能を誇っており、生成AIに対しての第3次AIブームをもたらす一因となりました。
その一方で、高いAI性能は軍事転用されるおそれがあるとして米国政府が輸出制限を設けています。一例としてNVIDIA A100やNVIDIA H100は輸出規制(禁止)が行われており、その規制に対応するように「NVIDIA A800」や「NVIDIA H800」がリリースされています。これらのGPUでは、チップ間の転送速度を半減させ、通常大量のGPGPUによって構成されるAIトレーニング性能を大幅に低下させ、米国の規制を回避しようとしています。
しかし、これらのGPGPUも今年10月に制限の対象になりました。さらにこれと同時に、「GeForce RTX 4090」や「NVIDIA L40」「NVIDIA L40S」などが追加されました。これらのGPUはH100よりも規模が小さいものです。とくにGeForce RTX 4090はH100と比べると遥に安価で入手することができます*2。
ちなみに、輸出規制の対象となる国は中国だけでなく、サウジアラビア、アラブ首長国連邦(UAE)、およびベトナムも含まれています。
RTX 4090D
RTX 4090DはRTX 4090と比較して若干カットされています。おそらくボード設計はそのまま流用できるように配慮されているはずなので、使用されているコアは280億トランジスタのGA102で共通となっているようです。VideoCardzによるとRTX 4090はGA102-300ですが、RTX 4090DではGA102-250となっているようです*3。
規模としては、SMが14基分小さくなっており、推定73.5TFLOPS(Nishiki-Hubにて算出)性能となっています。
RTX 4090 | RTX 4090D | |
---|---|---|
コア | GA102 | GA102 |
トランジスタ数 | 280億 | 280億 |
CUDAコア数 | 16384 | 14592 |
SM数 | 128 | 114 |
RTコア数 | 128 | 114 |
Tensorコア数 | 512 | 456 |
ベースクロック | 2,235MHz | 2,280MHz |
ブーストクロック | 2,520MHz | 2,520MHz |
メモリ | 24GB GDDR6X |
24GB GDDR6X |
メモリバス | 384bit | 384bit |
帯域幅 | 1008GB/s | 1008GB/s |
メモリ速度 | 21Gbps | 21Gbps |
消費電力 | 450W | 425W |
輸出基準
輸出規制はTotal processing performance(TPP)と、Performance Density(PD)の2つの基準で定められています。米国政府はTPPが4,800以上、PDが6.0以上の製品を対象としています。ただし、PDはデータセンター向け製品にのみ適用され、コンシューマ向けGPUには適用されません*4。
4,800以上のプロセッサを輸出規制の対象としています。算出例としては{FP32 Performance} * 32
です。RTX 4090で算出すると5,280という値となり、規制対象となるわけです。
RTX 4090Dの理論性能を73.5 TFLOPSとしてTPPを計算した場合は4,704となり、この基準をクリアしています。そして、データセンター向けGPUでは無いため、PDは無視されます。
よって、米国の基準をクリアするため、中国に提供可能だということになります。
関連リンク
*1:GeForce RTX 4090 D 显卡 | NVIDIA
*2:U.S. Govt Restricts Shipments of GeForce RTX 4090 to China, Other Countries | Tom's Hardware
*3:NVIDIA launches GeForce RTX 4090D with 14592 CUDA cores, 24GB G6X memory and 425W TDP - VideoCardz.com
*4:No, Nvidia Isn't Breaking GPU Sanctions Against China, Says Analyst | Tom's Hardware