錦です。
Appleが9日のイベントで明らかにした「Apple M1 Ultra」について、各種ベンチマークが出てきましたので、詳細な仕様とともにその内容をお伝えしたいと思います。
Apple M1 Ultraの仕様
「Apple M1 Ultra」は、現在存在するApple Siliconの中で最上位の規模のシリコンを持つSoCです。Appleは「Apple M1 Max」を「UltraFusion」というインターコネクトで連結させたチップとしており、実質的にそのままM1 Max×2の構成となっています。
これは、M1 Proのうち、メモリとGPUだけをスケールしたM1 Maxの成り立ちとは異なるものです。
各種コア数をM1 Maxと並べて書きます。
M1 Max | M1 Ultra | ||
---|---|---|---|
CPU | 計コア数 | 10 | 20 |
性能コア | 8 | 16 | |
効率コア | 2 | 4 | |
GPU | コア数 | 32 | 64 |
実行ユニット | 4096 | 8192 | |
RAM | 容量 | 64GB | 128GB |
スタック | 4 | 8 | |
帯域 | 400GB/s | 800GB/s | |
エンジン | Neural Engine | 16 | 32 |
エンコーダ | 1 | 2 | |
デコーダ | 2 | 4 | |
RAWエンコーダ/ デコーダ | 2 | 4 |
CPUコア数は、20コア。性能:効率は8:2のまま倍増しているので、16 性能コアと4 効率コアで構成されています。また、GPUも64コアから最大128コアになりました。実行ユニットは8192コア。
特筆すべき点は、Neural Engineが32コアで倍増しているということ。このNeural EngineはApple A14で、A13からNeural Engineの倍増はあったものの、A14をスケールさせたM1やM1 Pro、M1 MaxではNeural Engineの増加はなくすべて16コアでした。しかし、M1 Ultraでは初めてそれが増えました。実際には、M1 Maxを2つなのでNeural Engineごと増えたということみたいです。
Neural Engineでは1秒間に22兆回もの計算が実行できます。この数字もM1 Maxの2倍です。
その他、メディアエンジン各種が倍増していて、なんと18ストリームの8K ProRes 422の再生ができるというモンスターです。
コアの仕様は、性能コアが「Firestorm」で、効率コアが「Icestorm」Apple A14と同じコア。後で紹介するベンチマークで明らかになった性能コアのクロックは最大3.22GHz。M1/M1 Pro/M1 Maxと全く同じです。ほんとに同じコアをスケールしてるだけだと言うのがよく分かります。
キャッシュですが、性能コアのL1命令キャッシュが192KB、L1データキャッシュは128KB、L2キャッシュは48MB。効率コアは命令キャッシュが128KB、データキャッシュが64KB、L2キャッシュが8MBです。
ベンチマーク
では、これからベンチマークを紹介していきます。
CPU(Geekbench 5)
まず、Geekbench 5で計測したCPU性能から見ていきます。
Geekbench 5で計測されたApple M1 Ultraの性能は以下の通りでした。
現時点で確認できたのはこの一つのみでした。では比較してみます。
Apple同士で比較
はじめに同じアーキテクチャを共有するApple A14とM1シリーズからの比較。
基本的にこの部分は性能コアが倍増するごとに性能も倍になります。CPUにおいてはコア構成が全く同じM1 ProとM1 Maxを除いてその傾向が強く出ているのが特徴。M1 Ultraは、コア数がM1 Maxの倍になっているのでおおよそM1 Maxの倍のマルチスコアになりました。
シングルはアーキテクチャを共有している点とこの中ではApple A14以外がクロックも3.2GHzで共有しているのでほぼ同じです。ただ、M1 Ultraは冷却性能が高いのか他のM1よりも高い1800に迫るスコアを見せています。
Apple A15との比較は、A14とA15でCPU性能に大きな差がなかったので割愛します。
マルチ比較
では競合とのスコアを見ていきます。まずはマルチ性能です。
今回比較対象としたのは、「Ryzen Threadripper 3000」シリーズの上位2モデル、Mac Proにも搭載されているXeon-W 3200シリーズの最上位「Xeon W-3275M」、あとメインストリームのCoreとRyzenの最上位です。
まず、Zen 2でひと世代前とは言え一昨日まで最新世代だった「Ryzen Threadripper 3000」シリーズの上位であるモデルと結構いい勝負をしています。とくに32コアを打ち破ったのは衝撃的で、64コアに追いつきそう。AppleはSMTやHTTのようなものはないのでスレッド数はそのままコア数なので、64スレッドが20スレッドに負け、128スレッドが20スレッドに追いつかれそうという感じです。
あと、メインストリーム系で競合となる「Core i9-12900K」や「Ryzen 9 5950X」でもM1 Ultraの圧勝。Mac ProのXeon W-3275Mにも勝っています。
単純に、CPU性能がいいってのもあると思いますが、今回メモリ帯域が800GB/sにもなっているので、128GBというメモリの多さや、512bitというメモリバス、そして帯域を含めてマルチ性能が向上しているということも考えられます(HBMに追いつきそう)。
シングル比較
ただ、シングルはIntelに対してやや及ばず。これについては、M1登場後に登場したRocket Lakeのおアーキテクチャ「Willow Cove」でシングルスレッド性能が大幅改善された時点でM1を上回っており、その後に行われたアップデートAlder Lakeの「Golden Cove」でさらなる最適化が施された結果、M1 Ultraより高いシングル性能が発揮されています。
今後、5.5GHzまでシングルクロックが向上する「Core i9-12900KS」の登場もあり、アーキテクチャの更新がないM1の間はIntelに勝つことは無理そう。
RyzenはZen 2〜Zen 3そして、このグラフには有りませんがZen 3+も含めてシングル性能はAppleやIntelには及んでいません。
CPU(Cinebench R23)
ついで、Cinebench R23のスコアを見ます。
Geekbenchと並んで人気のあるCinebench R23の性能比較をします。Geekbenchが総合的な性能を測るベンチなのに対して、Cinebenchは決められたシナリオ通りに3DCGを制作して性能を測るレンダリング性能に特化したものです。
CPU関連のツイートを行っているwiteken氏のこちらのツイートを参考にします。
Cinebench R23 benchmark [citation needed]:
— witeken (@witeken) March 9, 2022
Core i9 12900K: single core: 2019 - multicore: 27669
M1 Ultra: single core: 1562 - multicore: 24566
その他の情報はCPU Monkeyを参照しました(このサイトの信憑性は低めですが、ベンチマークについては調べた所、ありうる数字なので参照します)。
Apple同士
まず、Apple同士を戦わせます。
Apple同士の比較では、シングルはほぼ同等のものの、マルチが大幅にM1 Ultraが上回っています。こちらはGeekbenchと同じような感じになっています。
問題は他社との競合です。
シングル比較
こちらがシングルのCinebench R23の比較。Geekbenchとは大きく異なり第12世代CoreどころかRyzenや第11世代Coreにも及ばないレベル。これは、Apple Siliconが特定のワークフローに対して脆弱であるということを示しているようにも見えます。
ちなみにCinebenchは以前よりIntelやAMDに対してAppleが低いということがあり、このエンジンとしてAppleが苦手としている可能性がありますね。アーキテクチャの特徴でもあります(逆にGeekbenchはSnapdragonの性能が出ないとか)。
とどのつまり、することによってはAppleよりIntelやAMDのほうが性能高いということです。
マルチ比較
このベンチマークをしている方ならご存知かと思いますが、このベンチのマルチは基本的にスレッド数が物を言うベンチマークです。そのため、Geekbenchで僅差だったRyzen Threadripper 3990XとはダブルスコアでM1 Ultraが負けています。また、Mac Proの56スレッドCPUよりも下回っています。
やはり、M1 Ultraは物理コアが20コアかつコア数=スレッド数なのに対して、IntelやAMDはHTTやSMTによってスレッド数が多いというのがかなり効きます。あと、M1やAlder Lakeなどでは、効率コアやEコアが足を引っ張りスコアが出にくいのも事実。
このベンチマークの結果から言えることは、M1 Ultraは総合的にコアを使うワークフローなら性能は出ても、コア数を求める場面では性能は他社に負けるということです。もちろん、M1 Maxよりも性能は高くはなりますが。
GPU性能
最後に、Geekbench 5のComputeスコアでGPU性能を見ます。ただ、現在明らかになっているのはM1 Ultra 48コアGPUのOpenCLが77164だったというもののみです。
M1同士で比較します。48コアなのでM1 Maxの1.5倍のコア数。AppleのGPUはコアが増えるとその分性能が上がりますので、1.4〜1.5倍の性能なら順当となりますが、今回のスコアでは1.36倍。予想から誤差の範囲で向上しています。
一応他のGPU友比べますが、OpenCLってどのGPUもあんまり性能が上がらないんですよね。
OpenCLはAppleとNVIDIA GPUを比較するのに向いているのですが、Apple GPUはOpenCLが低く、RTX 3050とRTX 3060の間くらいの性能に落ち着きました。もちろん、これだけで性能が決まるわけでは有りませんが、やはりといった印象。
ただ、今後Metalのスコアなどが出てくることによってApple GPUの凄さもどんどん見えてくることでしょうということで、GPUについては情報が増え次第更新します。
消費電力予想
消費電力の予想ですが、M1 Maxで私はだいたい90Wくらいになると予想しました。
Apple、「Apple M1 Pro」と「Apple M1 Max」を正式発表! ~ CPUとGPUとRAMを統合し最強の性能と効率を実現 消費電力も予想してみた。 - Nishiki-Hub
今回も同じ方法で予想してみようとしたんですが、似たようなグラフがAppleのイベント中に登場しませんでした。
ただ、M1 Ultraは何度も言っている通りM1 Maxをほぼ電力的に最適化せず倍増させた物なので、その消費電力もM1 Maxの2倍になると予想します。そうなれば180W程度になります。ただ、予想なので範囲を広げる170W〜200W程度になるでしょう。
Core i9-12900KのMax Turbo Powet(MTP/PL2)が241Wなので、それと比べてもかなり省電力です。Apple SoCは性能よりも効率性を重視しており、最も重要なのはこの部分かもしれませんね。