2024年も残りわずかとなりました。今年起きたことを振り返る時期でもあります。今回から数Partはそれに使いましょう。ということで1本目。今年CPU・GPU・NPUはどうなったのかについて見ましょう。
AI傾倒のプロセッサ
今年、Nishiki-Hubで取り上げる多くの分野において「オンデバイスAI」というのは書かせませんでした。2023年11月に「2024年のPC市場は"オンデバイスAI"と"アイドル時の電力効率"が重視される」なんて予想する記事を出しましたが、実際にその通りになったわけです。まあ、もちろん昨年からその兆候があって、結果が見えていた状態で予想したからあたっていないとおかしい予測ではありますけどね。
AIについては、Microsoftの「Copilot+PC」とAppleの「Apple Intelligence」がそれぞれ今年からサービスを開始したというのが非常に重要な出来事になりました。これらのサービスは「オンデバイスAI」のためのAIプラットフォームとなっており、ともにOpenAIのGPTをOSに組み込んでいる他、オンデバイスで処理が完結する小型のモデルを組み込んだ機能セットとなっています。例えば、画面内検索や記述している文字の検索、表示されている内容の説明や画像生成などをパッケージにしてOS機能の一部として提供する物となっています。
また、AppleもMicrosoftもOSのAPIやSDKとしてオンデバイスAI機能を気軽に開発者が組み込めるようなパッケージを提供しており、開発者が気軽にアプリに対してオンデバイスAIを統合できるようにしています。
そして、プロセッサのベンダーもこれに合わせて生成AIへ注力した一年となりました。
その中で今年キーワードとなったのは「NPU」です。NPUは「Neural Processing Unit」で、CPU・GPUに並ぶ第3のユニットとなっています。
NPUはその名の通りニューラルネットワーク用のアクセラレータとなっており、AIにおいて欠かせないものとなっています。中身については「AIに特化した低精度行列演算を得意とするアクセラレータ」であり、実際の構造もGPUと似通った物となっています。ただ、GPUよりも限定的で効率的であるという違いがあります。
CPU内蔵NPUの性能は、2023年の10 TOPS前後から、50 TOPS前後まで跳ね上がりました。Microsoftは、Copilot+機能を使用するための要件として、40 TOPSのNPU性能を求めたということもあるのですが、今年のCPU内蔵NPUのジャンプアップは驚きをもって受け取られました。
そんなNPUですが、各社の状況を見ていきます。
まず、変わり種としてQualcommです。Qualcommは、そもそも昨年の時点でスマホ向けSoC「Snapdragon 8 Gen 3」で45 TOPSを実現していました。今年登場した「Snapdragon X Elite」でも45 TOPSなのでそのままPCに持ってきたということになります。Qualcommは後述のとおり、X EliteにてPC向けSoCを大幅にアップデートしたということもあり、NPU性能も登場時点でトップとなりました。パッケージ全体では75 TOPS。
そして、Intel。Intelは、2023年12月に投入した第1世代Core Ultraこと「Meteor Lake」ラインナップにて、初めてNPUを搭載。Meteor LakeのNPUは11 TOPSと競合他社と比べて控えめの性能でしたが、今年登場した第2世代Core Ultraである「Lunar Lake」は、新世代のNPUを採用したこともあり最大48 TOPSとなっています。IntelのNPUはAMDに対して性能は劣るものの、GPUの演算性能が高い関係でパッケージ全体では120 TOPSと性能が突出しています。
AMDは、2023年1月投入のRyzen 7040に初めてXilinxのFPGAをベースとし、10 TOPSの「XDNA」アーキテクチャベースのNPUを採用。今年の1月に投入したRyzen 8040シリーズでは16 TOPSにパワーアップしたXDNAを搭載しました。そして、夏には「Ryzen AI 300」シリーズに、第2世代NPUとなる「XDNA 2」を搭載し、NPU単体で最大55 TOPS、パッケージで85 TOPSの性能を提供しています。
Appleは、2023年投入の「Apple A17 Pro」で35 TOPSを実現、今年になって投入したMacとiPad向けの「Apple M4」が38 TOPSを達成しています。Appleに関しては、Copilot+ PCの要件に従う必要がないため40 TOPS以下と低め。ちなみに、Apple Intelligenceの要件は、どうやらM1以降のApple Siliconと8 GBメモリとなっているため、原則買い替えを要求しているCopilot+ PCより要件がかなり甘いです。
省電力重視
今年のPC市場におて予測していたのは「オンデバイスAI」だけではありません。省電力についても予想していましたね。
2020年にPC市場にAppleが参入して以降、省電力デバイスの競争が一気に加熱しました。そして今年は、QualcommがArm ISAで独自設計IPである「Oryon」CPUを搭載した「Snapdragon X Elite」を投入。競争が更に加速。
この省電力競争において槍玉に挙げられやすいIntelですが、今年は省電力重視のCPU設計となりました。
IntelはIntel Hybrid Technologyとして、PコアとEコアのハイブリッド構造を採用していますが、それを維持しつつ、昨年末に投入され今年普及フェーズだった「Meteor Lake」では、SOCタイルにシステム駆動に最小限必要なユニットを詰め込み「Low Power Island」としてアイドル時にCPUやGPUを駆動しないようにするなどの工夫を投入しました。
さらに、9月に投入した「Lunar Lake」では、CPUのアイドル時の電力を極限まで抑えるべく、ネックになっていたHyper Threadingを無効化。Arrow Lakeでも同様となっています。結果として、省電力化に大成功。Arrow LakeでもRaptor Lakeよりも大幅に電力効率が上がっています。
アーキテクチャの改良
今年は、Intel、AMD、Qualcomm、Appleが各々アーキテクチャの大幅なアップデートを行いました。
Intelは前述の通り、省電力に特化した「Lion Cove」と「Skymont」を投入しましたね。
AMD Zen 5
AMDでは「Zen 5」を投入しました。Zen 5は、非常に大きな改良となっており、例えばIntel Hybrid Technologyで犠牲になったAVX-512を512-bitでフルサポートしたり、命令デコードから実行までというCPUの演算処理部分以外の範囲のスループットを向上するなどの改良が加えられています。もちろん、Zen 5cも投入されています。
Zen 5は、「Ryzen 9000」シリーズと「Ryzen AI 300」シリーズ、さらに「Turin」世代のEPYCに採用されています。Turinでは、最大128コア256スレッドのZen 5 EPYCと、最大192コア384スレッドのZen 5c EPYCがそれぞれ展開されました。
Qualcomm Oryon
Qualcomm Oryonは、Appleから独立したエンジニアが設立したNuviaというスタートアップ半導体設計企業の技術を基に開発されており、Raptor LakeやZen 4よりも高い性能と遥かに高い電力効率を有しています。アーキテクチャの詳細については私はあまり理解していませんが・・。
今年登場したCPU製品
では、今年登場したCPU製品を見てみます。
Intel
Lunar Lake
「Lunar Lake」は前述の通り、Intel初のCopilot+PC対応プロセッサです。省電力PC向けに設計されており、Apple SiliconやSnapdragonが明らかな競合相手です。
構成として、CPUのPコアに「Lion Cove」、Eコアに「Skymont」を、iGPUに「Xe2」を、NPUに第4世代NPUをそれぞれ搭載しています。更に、最大32GBのLPDDR5Xメモリをオンパッケージで搭載するなど、明らかに薄型軽量PCに向けたSoCスタイルのプロセッサを意識しました。
パッケージ構造はMeteor Lakeと同様にタイル構造を採用するものの、ベースタイルは引き続きIntel 22nm、CPUタイルはTSMC N3B、Platform ControllerタイルはTSMC N6で製造され、Foverosによって3Dパッケージングされています。
Lunar Lakeの興味深いところは、GPUに及びます。GPUはXe2-LPGを採用し、Meteor Lakeで省略されたXe Matrix eXtensionを前述の通り搭載いるほか、Intel Arc Bシリーズに先行してXe2アーキテクチャを採用しているなどの特徴があります。結果、GPU性能が向上しました。
Arrow Lake
「Arrow Lake」は、Lunar Lakeとともに第2世代Core Ultraを構成するプロセッサラインナップです。Lunar Lakeが省電力帯を占めるのに対して、Arrow Lakeは全般的に担います。今年登場したのは限定的で、デスクトップ向けの上位モデルのみとなりました。
デスクトップ向けCPUとしては初めてのCore Ultraかつタイル構造のCPUとなりました。実際には、Meteor Lakeのタイル構造をベースにCPUをLion Cove + Skymontに変更されています。NPUが初めて搭載されたデスクトップ向けIntel CPUでもありますね。
Thunderbolt 4をネイティブサポートするなど、プラットフォームのアップデートも大きく、ソケットもLGA-1851に変わっています。
Granite Rapids
Granite Rapidsは、今年登場したXeonラインナップです。第5世代スケーラブルプロセッサの後継ですが、第6世代スケーラブルプロセッサではなく、後述のSierra Forestとともに「Xeon 6」という新しいブランドで登場しました。
Granite RapidsとSierra Forestはプラットフォームとして互換性があり、LGA-4710とLGA-7529で分けられています。
Granite Rapidsは、Meteor LakeのPコアである「Redwood Cove」を採用し、最大96コア192スレッドのCPUとなっています。
Sierra Forest
Sierra Forestは、「Xeon 6」ブランドで登場した新しいCPUです。Granite RapidsがPコアのCPUを採用するのに対して、Sierra ForestはEコアの「Crestmont」を採用しています。
Granite Rapidsは性能重視でしたが、Sierra Forestは物理コア数が必要なクラウドなどの分野で投入され、Arm系のCobaltやGraviton、Ampereに対抗するものとなっています。
現時点で登場しているのは144コアまでの製品で、今後最大288コアのSierra Forestが登場する見込みです。
AMD
Hawk Point(Ryzen 8040/8045)
Hawk Pointシリーズは、Zen 4 CPUとRDNA 3 GPU、XDNAを採用しています。1月に登場したこともあり、まだオンデバイスAIが超重要視されたわけではなく、Copilot+PCには対応していません。
ですが、NPUの性能が10 TOPSから16 TOPSに向上しています。
Phoenix(Ryzen 8000G)
Phoenixシリーズは、昨年登場したモバイル向けプロセッサですが、そのデスクトップ向けラインナップが今年登場しました。
デスクトップ向けx86 CPUとしては初めてNPUを搭載したモデルとなっています。
Strix Point(Ryzen AI 300シリーズ)
Strix Pointシリーズは、Zen 5 CPUとRDNA 3.5 GPU、XDNA 2を搭載したモバイル向けCPUラインナップです。ブランド名が「Ryzen AI」となっている通りAI特化型で、Copilot+PCに対応する初めてのAMD CPUとなっています。
CPUはZen 5を採用している他、GPUにはRDNA 3をモバイル向けに強化したRDNA 3.5、そして第2世代NPUとなるXDNA 2を搭載しています。
Granite Ridge(Ryzen 9000シリーズ)
Granite Ridgeは、Zen 5 CPUを採用するデスクトップ向けCPUです。Ryzen 9 9950Xを頂点とした2年ぶりのデスクトップ向けCPUとなりました。
Turin
Turinは、Zen 5とZen 5cベースのEPYCラインナップです。
Zen 5をサポートするEPYCラインナップは最大128コア256スレッド、Zen 5cをサポートするラインナップは最大192コア384スレッドとなっています。
x86 CPUの中で、ソケットあたりの物理コア数が最大となるのはIntelのSierra Forestですが、論理コア数が最大となるのはこちらとなります。
Qualcomm
Snapdragon X
Snapdragon Xシリーズは、「Snapdragon X Elite」と「Snapdragon X Plus」からなるQualcommの新型PC向けSoCです。
前述の通り、Oryonという新しいIPを採用したCPUで大幅に性能を向上さしており、コア数も最大12コアとなっています。
これに合わせて、ソフトウェア周りでも強化されており、ChromeがArmにネイティブ対応しているほか、Windows 11のx86エミュレータが更新されるなどしています。
Snapdragon 8 Elite
Snapdragon 8 Eliteは、第2世代Oryonを採用したモバイル向けSoCです。
Oryonとしては初めてのbig.LITTLE構造に対応しています。
Apple
Apple M4
Apple M4ラインナップは、Appleの新型SoCラインナップです。
CPUはArmv9に対応したことにより、AMXからSMEやSVEに対応したと見られ、一部のワークロードで大幅な性能向上を果たしています。更に、全体的にCPUコア構成が見直されています。
GPUは、M3からのマイナーチェンジとなっているようですが、ディスプレイエンジンが強化された結果、Apple Siliconで課題だったディスプレイ出力枚数の制限が緩和されましたね。
Neural Engineの理論性能が18 TOPSから38 TOPSに向上しました。
A18ラインナップ
A18ラインナップは、Apple Intelligenceに最適化された新しいiPhone向けSoCです。
メモリが8GBとなっている他、GPUが強化されています。CPUはM4と同様にArmv9に強化されているようです。
GPU
今年は巡り的にGPUのアップデート時期となりましたが、やや後ろにズレているようです。
Intelは「Intel Arc B」を発表しました。まだ十分なデータを私が持ってないのでなんとも言えませんが。まさか第一弾になるのがIntelになるとは・・・。
Intel Arc Bシリーズが採用咲いているXe2では、より低精度の演算に対応し、SIMD32からSIMD64に変わるなどの変化がありました。さらに、演算実行パイプラインなどもアップデートされています。
そして、NVIDIAもBlackwellというGPUアーキテクチャを発表しています。Blackwellは、FP64の性能において32%の性能向上、Tensorコアによる低精度においては2.5倍の性能向上があります。具体的にAIに特化した性能向上が見られたということになります。
これらのGPUについては来年以降にコンシューマ向けに展開されることになるでしょう。
もう一点。AMDはCDNA系のInstinctを発表投入しました。MI325Xです。
現状、GPGPUとしてNVIDIAと対等に張り合えるのはAMDのみとなっています。その中で、NVIDIAほどの性能はないものの、コスパでAMDは勝負しているわけです。実際、MI325XはBlackwellには匹敵しないものの、H200程度の性能はあるとのことで、需要が大きすぎて供給が安定しないNVIDIAに対して、安価かつ安定して入手できるAMDを選ぶという企業は結構あるみたいです。
ちなみにIntelも、AI用のアクセラレータとしてGaudiを投入していますが、こちらはあまり聞かないですね・・・。
〆
ということで、今回は雑ですが、2024年のCPU・GPU・NPUの動向をまとめてみました。かなり駆け足になってしまったのでわかりにくかったらごめんなさい・・・。