[
錦です。
NVIDIAは同社が3月に開催されたGTC 2022で発表した「NVIDIA H100」のデータシートを更新し、FP64性能が向上している事がわかりました。
アップグレード
アップグレードされたのはH100の仕様上の理論性能です。
FP64性能が30 TFLOPSから34 TFLOPSに、FP32性能が60 TFLOPSから67 TFLOPSにそれぞれ向上しています。60とかっていう大きめな数字だから目立ちませんけど、7 TFLOPSってエグいですよ。。。
更新後の仕様は以下のとおりです。
SXM | PCIe | |
---|---|---|
FP64 | 34 TFLOPS | 26 TFLOPS |
FP64 Tensor Core | 67 TFLOPS | 51 TFLOPS |
FP32 | 67 TFLOPS | 51 TFLOPS |
TF32 Tensor Core | 989 TFLOPS | 756 TFLOPS |
BFLOAT16 Tensor Core | 1979 TFLOPS | 1513 TFLOPS |
FP16 Tensor Core | 1979 TFLOPS | 1513 TFLOPS |
FP8 Tensor Core | 3958 TFLOPS | 3026 TFLOPS |
INT8 TensorCore | 3958 TOPS | 3026 TOPS |
メモリ | 80GB | 80GB |
メモリ帯域 | 3.35TB/s | 2TB/s |
SXM版のみ、メモリ帯域が3TB/sから3.35TB/sに350GB/sほど向上しています。
なお、これに伴う消費電力の向上や他仕様への影響はありません。
NVIDIA H100は今月から搭載デバイスが登場し始めます。