錦です。
Intelは昨日の発表会にて、同社の実質初のdGPUシリーズ「Arc」から「Intel Arc A」シリーズを正式発表しました。
Intel初・・・
「Intel Arc」は、IntelのディスクリートGPUのブランドです。今回登場したのはその初代アーキテクチャとなる「Xe」を採用したモバイル向けdGPUです。
Intelは、既にモバイル向けdGPUとして「Iris Xe MAX」というGPUをリリースしていますが、こちらはLPDDR4xを採用するなど、どちらかというと、Core i7-1195G7などのiGPUを抜き出してdGPU化したようなGPUとなっています(GPU補助装置みたいな?)。
一方で、今回登場したGPUたちは、レイトレーシング用のユニットや、Xe Matrix eXtention(XMX)などの演算器がかなり拡充されています。それもGeForce RTXやRadeon RXに負けないくらい。
ラインナップ
ダイの種類の話は後にして、先にラインナップのの話から。
A350M | A370M | A550M | A730M | A770M | |
---|---|---|---|---|---|
Xeコア | 6 | 8 | 16 | 24 | 32 |
Render Slice | 2 | 2 | 4 | 6 | 8 |
Ray Tracing Unit | 6 | 8 | 16 | 24 | 32 |
XMX | 96 | 128 | 256 | 384 | 512 |
Vector Engine | 96 | 128 | 256 | 384 | 512 |
ベースクロック | 1150 | 1550 | 900 | 1100 | 1650 |
TGP | 25-35W | 35-50W | 60-80W | 80-120W | 120-150W |
接続 | PCIe 4.0 x8 | PCIe 4.0 x8 | PCIe 4.0 x16 | PCIe 4.0 x16 | PCIe 4.0 x16 |
メモリ | 4GB GDDR6 |
4GB GDDR6 |
8GB GDDR6 |
12GB GDDR6 |
16GB GDDR6 |
メモリバス | 64bit | 64bit | 128bit | 192bit | 256bit |
メモリ速度 | 14Gbps | 14Gbps | 14Gbps | 14Gbps | 16Gbps |
メモリ帯域 | 112GB/s | 112GB/s | 224GB/s | 336GB/s | 512GB/s |
ラインナップはArc 3/5/7と、Core i見たくミドルハイエントリがわかりやすい製品名になっています。世代を示すのは頭のAで、これは「Alchemist」の頭文字を採っているものと見られます。
各コア
各コアの説明をかんたんにします。詳しくはこちらの記事をご覧ください。
Xeコアは、Vector EngineとXe Matrix eXtention(XMX)を16基ずつ、Save/RestoreのAGU、ローカル共有メモリ(LSM)、L1キャッシュを搭載している性能においての最小単位です。
XMXは、1024bit演算を行うマトリクスエンジンです。この部分でXe Super Sampling(XeSS)の処理を行います。もっというと機械学習系はここで処理するみたいです。Vector Engineは単純にベクトルの処理をお個合う部分です。
Render Sliceは、Xeコアを4基包括した上で、3Dグラフィックスを生成するために必要なレンダリングユニットが含まれています。具体的には、4基のXe-Coreと、レイトレ用のアクセラレータ(Raytracing Unit)を4基、DirectX 12 Ultimateに対応するサンプラー、ピクセルバックエンド、ジオメトリ、ラスタライズパイプラインが搭載されています。
A350Mを除いて、フルのRender Sliceを採用しているようですね。A350Mは1基だけXeコアが無効化されたRender Sliceを2基採用しているんですかね。
ダイ
ダイは2種類です。
ACM-G11 | ACM-G10 | |
---|---|---|
Render Slice | 2 | 8 |
Xeコア | 8 | 32 |
XMX(EU) | 128 | 512 |
レイトレユニット | 8 | 32 |
L1キャッシュ(コアあたり) | 192KB | 192KB |
L2キャッシュ | 4MB | 16MB |
PCIe 4.0レーン | x16 | x8 |
Xe メディアエンジン | 2 | 2 |
Xe ディスプレイパイプ | 4 | 4 |
トランジスタ数 | 72億 | 217億 |
ダイサイズ | 157mm2 | 406mm2 |
Intel GPUは、ともにTSMC N6プロセスで製造されます。
PCIe 4.0の接続を見る限りだと、A350M/A370MはG11、それ以上がG10のダイになっている感じですかね。
ダイサイズは、上位のG10が406mm2。こちらはRTX 3070などに採用されるGA104 GPU(392mm2)と似通ったサイズになっています。トランジスタ数も見ると、217億という数字は、GA102とGA104の中間くらいの数、Navi 23とNavi 22の中間くらいの数です。
G11側は、157mm2というダイサイズは、エントリグレードとほぼ同等波と見られます。モバイル向けRTX 3050にも採用されるGA107がこれくらいのサイズと言われています。トランジスタ数も・・・かな。
機能面
製品が登場するということもあり、機能面も明らかになっています。
既に公式に明らかになっている内容としては、XMXはを利用したサンプリング技術「XeSS」が利用可能になっていることや、Direct X Raytracing(DXR)やVulkan Raytracingをフルサポートしたハードウェアレイトレーシングも利用可能です。
XeSS(Xe Super Sampling)は、NVIDIAのDLSSに競合する超サンプリング技術となります。なお、AMDのRSRと違い、ゲーム側の対応が必要になるほか、FSRと違いArc GPUである必要があります。
この製品の発表と同時に、旧来のIntel Graphics Command Centerが「Intel Arc Contorol」に変更されます。これは、Arcだけでなく、Intel iGPUでも変更されます。
表示部分の機能としては、VESAの「Adaptive Sync」をサポートしています。独自でいうと、最新のフレームをできるだけ高速に表示する「SpeedSync」、2つのフレームを統合してすることでをテアリング(ズレやちらつき)を軽減する独自の防止機能「SmoothSync」にも対応します。
Intel CPUとの連携
IntelのGPUなのでIntel CPUと連携も良く「Deep Link」に対応します。
まず、CPUのSoCとGPUが熱設計を動的に融通し合う機能「Dynamic Power Share」や、それぞれのエンコーダを両方使うことでエンコードを高速化する「Hyper Encode」、そして、AI推論をiGPUとeGPUに分けることで性能を引き上げる「Hyper Compute」に対応します。