錦です。
NVIDIAは、GTC 2023にて「NVIDIA RTX 4000 SFF」およびモバイルワークステーション向け「NVIDIA RTX ADA」シリーズを発表しました。
RTX 4000 SFF Ada
RTX 4000 SFF Adaは、GeForce RTX 40シリーズと同様にAda Lovelaceアーキテクチャを採用したプロ向けのGPUです。上位には「RTX 6000 Ada」があります。
6144基のCUDAコア、192基のTensorコア、48基のRTコア、48基のSMで構成されており、320GB/sのメモリ帯域を持つ160bitインターフェイスの20GBものGDDR6 ECCメモリが搭載されています。RTコアは第3世代、Tensorコアは第4世代となっており、TensorコアにはTransformer Engineが搭載されており、GPTを始めとしたTransformerモデルに対して高い性能を誇ります。
興味深いことに、このカードのTBP(Total Board Power)は70Wとと非常に小さく、補助電源が必要ありません。
また。2スロット・シングルファンと大規模な割にコンパクトです。
しかし、性能が低いわけではなく単精度性能は19.2 TFLOPS、RTコアの理論性能が44.3 TFLOPS、Tensor性能が306.8TFLOPSとなっています。
モバイル向け
モバイル向け「RTX 4000 Ada」シリーズも同様にAda Lovelaceアーキテクチャをベースにしています。
RTX 5000 Ada | RTX 4000 Ada | RTX 3500 Ada | RTX 3000 Ada | RTX 2000 Ada | |
---|---|---|---|---|---|
CUDA | 9728 | 7424 | 5120 | 4608 | 3072 |
RTコア | 76 | 58 | 40 | 36 | 24 |
Tenserコア | 304 | 232 | 160 | 144 | 96 |
ブースト クロック |
2.19GHz | 2.26GHz | 2.25GHz | 2.16GHz | 2.36GHz |
メモリ | 16GB GDDR6 |
12GB GDDR6 |
12GB GDDR6 |
8GB GDDR6 |
8GB GDDR6 |
メモリバス | 256 bit | 192 bit | 192 bit | 128 bit | 128 bit |
メモリ帯域 | 576GB/s | 432GB/s | 432GB/s | 256GB/s | 256GB/s |
TGP | 80~175W | 60~175W | 60~140W | 35~140W | 35~140W |
FP32 | 42.6 TFLOPS | 33.6 TFLOPS | 23.0 TFLOPS | 19.9 TFLOPS | 14.5 TFLOPS |
RT | 681.8 TFLOPS | 538.0 TFLOPS | 368.6 TFLOPS | 318.6 TFLOPS | 231.6 TFLOPS |
Tensor | 98.5 TFLOPS | 77.8 TFLOPS | 53.3 TFLOPS | 46.0 TFLOPS | 33.5 TFLOPS |
GeForce RTX 40シリーズと同様にコンフィギュラブルTGPが仕様となっており、ベンダーはデバイスの熱設計によって性能を調整することができます。
こちらももちろん、Transformer Engineを統合したTensorコアや、SERが利用可能なRTコアも統合されています。