今朝から面白そうな話題が飛んできましたので、そのことを記事にしようかと思います。富岳の話ですね
富岳が米国のスパコン3つに敗北して4位に転落した!!!と字面だけ取れば、なんだかなと思うものですが、スパコンは日々進歩するものであり、後発製品が性能を上回ることは当たり前ですね。富岳の凄みというのは、どちらかというと、1位を独占した期間がちょっと長かったこと。
富岳
少し富岳の説明だけ。
富岳は、日本の理化学研究所と富士通が共同開発したスーパーコンピューターで、富士通が開発したArmv8.2 ISAとSVE拡張に対応し、2.2GHzで駆動するA64FXを搭載しており、ノード毎に52コア(実稼働は48コアの模様)それが158,976ノードで構成された計7,630,848コアのスーパーコンピュータです。
富岳は、2021年に稼働が開始されており、スパコン「京」の後継となっています。一時期は、飛沫演算を富岳で行ったことから飛沫演算専用マシンなんて揶揄されたものですが、普通に考えてアレを富岳の全パワーを使って処理してたらそれはそれで面白い。
現在は、東工大や富士通などが、生成AIを作るために富岳で大規模言語モデルを用いた開発を進めています。
今回の各結果
では今回の結果を見ていきます。
まず、各報道機関が4位に転落したとする「TOP500」は報道通り4位。しかし、「HPCG」と「Graph500」においては、登場以降8基連続の1位を維持しました。残す「HPL-MxP」は3位となっています。
それぞれの評価の意味は以下の通り。
- TOP500:HPLベンチマークの評価
- HPCG:共役勾配法での連立一次方程式を解いている部分の計算性能。産業向けのアプリケーションで多用。*1
- Graph500:1秒間にグラフのエッジ(枝)を辿る(トラバースする)操作の回数*2
- HPL-MxP:混合精度アルゴリズムを使用して線形方程式系を解く性能の評価。AIやHPC向け*3
富岳の結果は次の通り
順位 | 性能 | |
---|---|---|
TOP500 | 4 | 442.01 PFLOPS |
HPCG | 1 | 16,004.50 PFLOPS |
HPL-MxP | 3 | 2,000.00 PFLOPS |
Graph500 | 1 | 138,867 TEPS |
今回のTOP500ランキングの上位10位を見てみることにします。
順位 | 名称 | 国 | 設置団体 | ベンダー |
---|---|---|---|---|
1 | Frontier | 米国 | オークリッジ国立研究所 | HPE |
2 | Aurora | 米国 | アルゴンヌ国立研究所 | Intel |
3 | Eagle | 米国 | Microsoft | Microsoft |
4 | 富岳 | 日本 | 理化学研究所 | 富士通 |
5 | LUMI | フィンランド | EuroHPC/CSC | HPE |
6 | Leonardo | イタリア | EuroHPC/CINECA | EVIDEN |
7 | Summit | 米国 | DOE/SC/ オークリッジ国立研究所 |
IBM |
8 | MareNostrum 5 ACC | スペイン | EuroHPC/BSC | EVIDEN |
9 | Eos NVIDIA DGX SuperPOD | 米国 | NVIDIA | NVIDIA |
10 | Sierra | 米国 | DOE/NNSA/LLNL | IMB/NVIDIA/ Mellanox |
新たにランキングインしたのは、「Aurora」「Eagle」「MareNostrum 5 ACC」「Eos NVIDIA DGX SuperPOD」の4基。一方で中国勢の新機種はなく、6月に10位以内に入っていた「Sunway TaihuLight」「Tianhe」はともに10位以下となりました。
若干気になるのが、9位に入ったDGXシステム。AI性能ではもしかしたら、この中でダントツの可能性があるスパコンです。NVIDIAの本気度。恐るべし。ちなみにNVIDIAは、今回順位を落として10位以降となりましたが、前回も別のシステムが10位以内に入っています。
順位 | 名称 | Rmax (PFLOPS) |
Rpeak (PFLOPS) |
電力 (kW) |
---|---|---|---|---|
1 | Frontier | 1194 | 1679.82 | 22703 |
2 | Aurora | 585.34 | 1059.33 | 24687 |
3 | Eagle | 561.2 | 846.84 | |
4 | 富岳 | 442.01 | 537.21 | 29899 |
5 | LUMI | 379.7 | 531.51 | 7107 |
6 | Leonardo | 238.7 | 304.47 | 7404 |
7 | Summit | 148.6 | 200.79 | 10096 |
8 | MareNostrum 5 ACC | 138.2 | 265.57 | 2560 |
9 | Eos NVIDIA DGX SuperPOD | 121.4 | 188.65 | |
10 | Sierra | 94.64 | 125.71 | 7438 |
性能を見るとこんな感じ。Frontierすごいなっていう感想が出ますね。
ところで、プロセッサの系統をちょっとまとめてみようと思ったんですよね。
順位 | 名称 | CPU | CPU系統 | GPGPU | GPU系統 | インター コネクト |
---|---|---|---|---|---|---|
1 | Frontier | 第3世代EPYC 64C | x86(AMD) | Instinct MI250X | CDNA(AMD) | Slingshot-11(HPE) |
2 | Aurora | Xeon Max 9470 52C | x86(Intel) | Intel DC-GPU Max | Xe-HPC(Intel) | Slingshot-11(HPE) |
3 | Eagle | Xeon Platinum 8480C 48C | x86(Intel) | NVIDIA H100 | Hopper(NVIDIA) | Infiniband NDR(NVIDIA) |
4 | 富岳 | A64FX | Arm | Tofu Interconnect D(富士通) | ||
5 | LUMI | 第3世代EPYC 64C | x86(AMD) | Instinct MI250X | CDNA(AMD) | Slingshot-11(HPE) |
6 | Leonardo | Xeon Platinum 8358C 32C | x86(Intel) | NVIDIA A100 | Ampere(NVIDIA) | Infiniband HDR(NVIDIA) |
7 | Summit | POWER9 22C | PPC(IBM) | Volta GV100 | Volta(NVIDIA) | EDR Infiniband(NVIDIA) |
8 | MareNostrum 5 ACC | Xeon Platinum 8460Y 40C | x86(Intel) | NVIDIA H100 | Hopper(NVIDIA) | Infiniband NDR(NVIDIA) |
9 | Eos NVIDIA DGX SuperPOD | Xeon Platinum 8480C 56C | x86(Intel) | NVIDIA H100 | Hopper(NVIDIA) | Infiniband NDR(NVIDIA) |
10 | Sierra | POWER9 22C | PPC(IBM) | Volta GV100 | Volta(NVIDIA) | EDR Infiniband(NVIDIA) |
PowerPCが現役なのも面白いのですが、やはり大半がXeonとEPYC。そしてGPGPUは採用するほぼ全てがNVIDIAという。その中で、完全に独自なのは富岳だけという具合です。インターコネクトを見ても、富岳以外は汎用型。ちなみにTofu Interconnect Dは京でも用いられていたもので、Armに変わったとて構造的にはかなり京に近い構造となっています。京はPowerPCですから、PowerPCの構造自体はスパコンではかなり現役選手であると言えます。
続いて、HPCGのランキング。
順位 | 名称 | 国 | 設置団体 | ベンダー |
---|---|---|---|---|
1 | 富岳 | 日本 | 理化学研究所 | 富士通 |
2 | Frontier | 米国 | オークリッジ国立研究所 | HPE |
3 | LUMI | フィンランド | EuroHPC/CSC | HPE |
4 | Leonardo | イタリア | EuroHPC/CINECA | EVIDEN |
5 | Summit | 米国 | DOE/SC/ オークリッジ国立研究所 |
IBM |
6 | Perlmutter | 米国 | DOE/SC/LBNL/NERSC | HPE |
7 | Sierra | 米国 | DOE/NNSA/LLNL | IMB/NVIDIA/ Mellanox |
8 | Selene | 米国 | NVIDIA | NVIDIA |
9 | JUWELS Booster Module | ドイツ | FZJ | Bull Sequana |
10 | AOBA-S | 日本 | 東北大学 | NEC |
こちらは、日本勢は、富岳だけでなく東北大学のAOBA-Sもランクイン。そして気になるのはNVIDIAさん。Hopper世代のDGX SuperPOD入ってないのにAmpere世代のSeleneが入ってる・・・。もしかしたら、ノミネートしてないのかもしれませんね。
最後に、HPC-MxP。こちらは5位まで。
順位 | 名称 | 国 | 設置団体 | ベンダー |
---|---|---|---|---|
1 | Frontier | 米国 | オークリッジ国立研究所 | HPE |
2 | LUMI | フィンランド | EuroHPC/CSC | HPE |
3 | 富岳 | 日本 | 理化学研究所 | 富士通 |
4 | Leonardo | イタリア | EuroHPC/CINECA | EVIDEN |
5 | Summit | 米国 | DOE/SC/ オークリッジ国立研究所 |
IBM |
AI
さて、この先やはりAIに置いてスパコンの行方が気になります。何度も申し上げている通り、今回第9位にランクインした「EoS NVIDIA DGX SuperPOD」システムは完全にAIをターゲットにしたものです。NVIDIAは富岳の4倍のAI性能を公称しています。そしてまだ出てきていない、Grace Hopper Superchips搭載スパコンの行方次第ではAI性能で追い抜かれる可能性があります。
その一方で、これは他のx86系統のスパコンにも言えたことですが、ベクトル拡張命令がある富岳。CPUでこれまで世界1だったからこその意味があると考えます。世界的に見てもGPUを使わないAIの研究というのはとてもユニークです。
富岳にはGPGPUの拡張計画はないわけではありません。ただ、理化学研究所の考えとしてはGPUをつけるつけないより、どうすれば計算速度が上がるのかという部分で勝負しているので、結果としてGPUが良いのであればGPUに、今のままがいいならいまのままでということになるでしょう。GPUもメリットの反面、デメリットもありますしね。
個人的には和製のLLMが登場しつつある中、富岳がどのように貢献するのかを中止するとともに、ポスト富岳を妄想してみたりもしてます。