Nishiki-Hub

国内外のPC/PCパーツ/スマホ/Appleなどの最新情報を取り上げています

NVIDIA、中国向け「GeForce RTX 4090D」を発表 ~ 若干小規模なGPUに

出典:NVIDIA

NVIDIAは、米国の中国に対する輸出制限政策に対応する新しい「GeForce RTX 4090D」を正式に発表しました*1

輸出規制

NVIDIA製のチップは、非常に高い性能を誇っています。特にAIや並列演算については世界随一の性能を誇っており、生成AIに対しての第3次AIブームをもたらす一因となりました。

その一方で、高いAI性能は軍事転用されるおそれがあるとして米国政府が輸出制限を設けています。一例としてNVIDIA A100やNVIDIA H100は輸出規制(禁止)が行われており、その規制に対応するように「NVIDIA A800」や「NVIDIA H800」がリリースされています。これらのGPUでは、チップ間の転送速度を半減させ、通常大量のGPGPUによって構成されるAIトレーニング性能を大幅に低下させ、米国の規制を回避しようとしています。

しかし、これらのGPGPUも今年10月に制限の対象になりました。さらにこれと同時に、「GeForce RTX 4090」や「NVIDIA L40」「NVIDIA L40S」などが追加されました。これらのGPUはH100よりも規模が小さいものです。とくにGeForce RTX 4090はH100と比べると遥に安価で入手することができます*2

ちなみに、輸出規制の対象となる国は中国だけでなく、サウジアラビアアラブ首長国連邦UAE)、およびベトナムも含まれています。

RTX 4090D

RTX 4090DはRTX 4090と比較して若干カットされています。おそらくボード設計はそのまま流用できるように配慮されているはずなので、使用されているコアは280億トランジスタのGA102で共通となっているようです。VideoCardzによるとRTX 4090はGA102-300ですが、RTX 4090DではGA102-250となっているようです*3

規模としては、SMが14基分小さくなっており、推定73.5TFLOPS(Nishiki-Hubにて算出)性能となっています。

RTX 4090 RTX 4090D
コア GA102 GA102
トランジスタ 280億 280億
CUDAコア数 16384 14592
SM数 128 114
RTコア数 128 114
Tensorコア数 512 456
ベースクロック 2,235MHz 2,280MHz
ブーストクロック 2,520MHz 2,520MHz
メモリ 24GB
GDDR6X
24GB
GDDR6X
メモリバス 384bit 384bit
帯域幅 1008GB/s 1008GB/s
メモリ速度 21Gbps 21Gbps
消費電力 450W 425W

輸出基準

輸出規制はTotal processing performance(TPP)と、Performance Density(PD)の2つの基準で定められています。米国政府はTPPが4,800以上、PDが6.0以上の製品を対象としています。ただし、PDはデータセンター向け製品にのみ適用され、コンシューマ向けGPUには適用されません*4

4,800以上のプロセッサを輸出規制の対象としています。算出例としては{FP32 Performance} * 32です。RTX 4090で算出すると5,280という値となり、規制対象となるわけです。

RTX 4090Dの理論性能を73.5 TFLOPSとしてTPPを計算した場合は4,704となり、この基準をクリアしています。そして、データセンター向けGPUでは無いため、PDは無視されます。

よって、米国の基準をクリアするため、中国に提供可能だということになります。

関連リンク