【編集後記】「Apple M3 Ultra」について考察

本日の内容

5日、Appleは「Max Studio」とともに新しいApple Siliconである「Apple M3 Ultra」を発表した。M4シリーズが登場している中でM3ラインナップを追加するというのは非常に興味深い。

Apple M3 Ultra

Apple MシリーズのUltraグレードは、MaxグレードをUltra Fusionというインターコネクトを用いて2基連結して構成された製品である。他社で言うところのマルチチップレット構造であるが、CPUやGPU、Neural EngineからSecurity Enclave、Display EningeからMedia Engineなどまで、SoCとして丸ごと2倍にしているので、形式的にはどちらかと言うとマルチソケットに近い。

連結しているということで、基本的にはM3 Maxの2倍の規模となっている。

CPU

CPUは最大24コアの高性能コアと、8コアの高効率コアで構成された32コア。Intel風に言うと24P8E。近年は、ワークステーション向けCPUでもIntelなら60コア(Xeon W-3595X)やら96コア(Ryzen Threadripper PRO 7995WX)やらと多コア傾向にある中で、Appleはそれほどコア数は増やさなかった。実にAppleらしいとも言えるが、多分その規模のCPUを実現するにはMac Studioの筐体では足りないのではないか。もし、M3 Ultraを更に連結する「M3 Extream」があるとしたら、トランジスタ数は実に3,680億基になり、Apple製品の中でその搭載を許すのはMac Proぐらいになるのではなかろうか。あくまで妄想になるが。

GPU

GPUは80コアGPUとなる。M3から見れば8倍大きなGPUになり、4Gamersに掲載された西川善司氏の記事によるとM3 Maxの理論性能が16.4 TFLOPSであるので、その倍と考えれば32.8 TFLOPS程度となる。これは、GeForceで言うとRTX 5070とRTX 4070 Superの中間辺り、Radeonで言えばRX 7700 XTよりやや劣る程度。理論性能はあくまで一指標にしかならないにしてもRTX 5070ちょい上と考えれば統合GPUにしてはかなりの性能と見れる。一方で、ワークステーションGPUとしては微妙な水準。

Neural Engine

そして、AI時代に注目されるNeural Engine。こちらについては具体的な値がわからないが、M3世代の16コアNeural Engineの理論性能が18 TOPSであるので、計算上36 TOPSとなる。これは、Apple A18の35 TOPSを上回るものの、Apple M4の38 TOPSを下回る。M4やA18が16コアでこのレベルの理論性能を叩き出しているのは低精度演算への対応によるものだろうが、残念ながらM3世代のM3 Ultraはこれに対応していないと見られる。

メモリ

メモリコントローラ自体も倍になっているので、メモリインターフェイスはM3 Maxの倍である1,024-bitとなる。これは、M2 UltraやM1 Ultraから変わらない。メモリはLPDDR5-6400のようで、帯域幅は819 GB/s。一方で、512GBという大容量メモリを有している。

ここで注目すべきなのが、819 GB/sにもなる超高帯域メモリを512GBも搭載しているという点だ。Apple Silicon MacがAI研究に歓迎される要因としてこのメモリが挙げられる。

GPUは基本的に最大1TB/s前後の帯域を有している。物によっては3TB/s程度まで達する。その反面で、メモリ容量自体はそれほど大きくない。単体であれば、NVIDIA B200が180GB、Instinct MI325Xが288GBである。しかも、それぞれのGPUは非常に効果であり、数百万円する。その中で、Mac Studioは一番高価なモデルでも200万円台でシステムごと入手することができ、しかも512GBという大容量の、しかも819GB/sという高帯域メモリを有している。これはMacの大きな利点だといえよう。

Appleはそのことは承知しているようで、Mac Studioの紹介時に「6000億パラメータのLLMをインメモリで実行できる」と謳っている。パラメータ数だけで見れば、GPT-3.5(3,500億)やPaLM(5,400億)グレードのLLMをインメモリで実行する事ができる。

M4 Ultraは・・・

Mac StudioのCPUラインナップは「Apple M4 Max」と「Apple M3 Ultra」となっている。Appleとしてはかなり異色で、最上位グレードがひと世代前となった。

普通に考えれば「Apple M4 Ultra」が登場してもおかしくない。

実際、M4 Ultraにすれば、Neural Engineの性能は76 TOPSにまで向上し、これは競合するIntel、AMD、QualcommのNPUと比較しても群を抜いて高い性能である。更に、GPU性能も40 TFLOPS程度になるだろう。メモリ帯域も1,092 GB/sと1TB/sを超える。更に、AI時代にSVE2やSME2をサポートするArmv9 CPUも搭載する。

では、なぜM4 Ultraではないのか。私はコストだと考える。

Appleは2023年11月下旬にM3を投入した後、翌年5月にM4を投入した。登場時期だけで見ると実に6ヶ月で世代交代が発生したわけだが、この要因には製造プロセスがあると言われている。

M3 Ultraを含めM3ラインナップとA17 ProはTSMC N3(N3B)で製造されている。しかし、報道によればN3Bの歩留まりが相当悪く、半分近くが不良品になったとのこと。結果としてAppleは、歩留まりが改善した新しい製造プロセスとしてN3Eに早々に移行したと言われている。

まあ、この報道にも一理あるが、この歩留まり率がM4 UltraではなくM3 Ultraを投入した直接的な要因ではないと考える。

結局M3を初めて搭載した「MacBook Pro」を10月31日に発表してから、ちょうど1年後に置き換えている。やや早いが、これは至って平均的なアップデート周期と見ることができる。さすがに稼働後1年半を超えるN3Bの歩留まりは改善していると見られており、実際Intelが最新のArrow LakeやLunar LakeでN3Bを使用している。

やはり、M4 Ultraを投入しなかったのはコストではないだろうか。N3Eは最新の製造プロセスである。おそらくウェハ価格はかなり高くなっているはずだ。それに、N3Bほど製造容量も確保できているわけではないだろう。その状態で、最大規模のM4 Maxを2基搭載するようなUltraを製造した場合、かなり高いコストになるかもしれない。

ただ、別の可能性もある。Mac Proとの差別化だ。

Mac Proは早ければ今年のWWDCでアップデートされるだろう。現状、Mac ProとMac Studioは同じM2 Ultraを搭載していた。dGPUも使えない状態のなか、Mac StudioではなくMac Proが必要となる環境は限られる。となれば、M4 UltraとM3 Ultraで差別化を図っているのかもしれない。

あくまでこれは筆者の妄想にすぎない。個人的に、一番おもしろい展開が、Mac ProにM4 Ultraや、その2倍の規模となるM4 Extreamなんて搭載されるなんていうものだ。64コアCPUに加え、GPU性能はRTX 4090程度にはなるし、Neural Engineは夢の152 TOPS、メモリも2TB/s超えの1TBも夢じゃない。おいくらになるのだろうか。

こういう妄想は楽しいものだ。