錦です。
Appleは、同社のSoCブランド「Apple Silicon」の第1世代「Apple M1」シリーズに「Apple M1 Ultra」を追加しました。
M1 Ultra
M1 Ultraは、M1 Maxを2つ「UltraFusion」というコネクタを介して接続しています。UltraFusionは、2.5TB/sでM1 Maxのダイ同士を接続するコネクタであり、ファブリックとしてはかなり高速なものになっています。
M1 Maxを2つつなげているので、コア数はしっかりM1 Maxの2倍となっており、最大4コアの効率コアと16コアの性能コア、最大128コア(8192実行ユニット)のGPUで構成されており、PC用向けでは最多である1,140億ものトランジスタを搭載しています。GPUの性能は21TFLOPSです。
素の話、メインストリームが16コアが最大なのでM1 Ultraの16性能コアは時代に追いついたものです。Appleが標的としているのはどちらかというとXeon W-3300やスケーラブルプロセッサ、Ryzen Threadripperなどでしょうけど、少コアでも64コアに挑めそうなスペックは持ち合わせているでしょう。もちろん数の暴力には負けますが、いいところまでは行くはずです。逆にそこらへんはMac Proの役割なのかも。
UltraFusion
基本、M1 Ultraのようにダイを複数ソケット、同じマザーに付けると、その間の接続部分(ファブリック)がネックとなりかつ、遅延などの問題もあり性能が2倍になるということはありえません。
その対策がUltraFusionという訳です。
UltraFusionですが、この2.5TB/sという帯域はかなりえげつないものです。これは、パッケージ内部のチップレット間の通信でさえも上回るスピードで、AMDの「Infinity Fabric」でもメモリクロックx32byte(DDR4-3200の場合100GB/s程度)が限界なのでそれの2.5倍の速度。しかもAMDと違って、メモリクロックがFabric(UltraFusion)の速度に影響しないので、安定して2.5TB/sの通信を行えます。
そしてさらに重要なのは管理方法。M1 Ultraは物理的にM1 MaxをUltraFusionによってくっつけているのですが、システム側はあくまでワンチップとして認識します。
そのため、開発者はデュアルソケットなどを気にしなくても良いという仕組みになっています。
エンジンの倍増
また、これまでM1からM1 ProやM1 Maxで触れられてなかった部分も倍になっておりNeural Engineが32コアで最多、ビデオのデコードエンジンが2基、エンコードエンジンが4基、ProResエンコード/デコードエンジンが4基となっています。
これが功を奏したのか、M1 Ultra搭載のMac Studioでは18の4K ProRes 422の動画を同時ストリームすることができます。
RAM
もちろんM1 Ultraも他のM1と同様にユニファイドメモリアーキテクチャ(UMA)に基づいています。容量は64GBあるいは128GBです。M1 Maxと同じなのであればLPDDR5メモリとなっています。
メモリ帯域は最大800GB/sになり、これはMac ProのRadeonで採用されていたHBM2メモリやNVIDIA GPUのGDDR6に迫る速度です。現行のMac Proの各GPUのvRAM帯域を大きく超えています。おそらくメモリインターフェイスは512bit。
メモリスタックは8個。いくらなんでもこの量のLPDDR5スタックを搭載するパッケージはこの世に存在しないでしょう。
電力効率と性能
電力効率については、やはりAppleかなり主張していて「Core i9-12900K」との比較で60W時点でM1 Ultraが90%性能を上回っているしています。
同様にGPU性能と電力効率もアピールしており、M1 Ultraは、RTX 3090とi9-12900Kシステムでは300W超えで得られる性能を200W少なく実現できるとしています。これGeForce RTX 3090よりも性能が高いって謳ってるんですよ、やばくないすか。
バリアント
今回発表されたバリアントは以下のとおりです。
CPU | GPU | NE |
---|---|---|
16P4E | 48コア | 32コア |
16P4E | 64コア | 32コア |
CPUのコア数は20コア固定で、GPUのコアがMacBook Pro同様M1 Maxあたり8こ無効化された48コアモデルと、すべて有効化されている64コアとなっています。