錦です。
Intelは、MediumにてIntelのゲーミングGPU「Intel Arc」についての情報を共有しています。
ものの話自体は、Architecture Dayで発表された内容のニュースリリースにあたるようなものなので、大体の話自体はこちらのエントリでお話している内容です。今回はそれに加えて、このドキュメントでわかった内容も加えてお伝えしています。
各ユニットの説明
Intelはこれまで、CPU内蔵のGPUについて、実行ユニット(Excution Unit/EU)と言う単位で表現していましたが、Xe HPGやXe HPCの規模が大きくなるにつれて、マイクロアーキテクチャの構成可能性を適切に表現するためにはEUが適さないということから、これが変わっています。具体的には、Xe Coreというのが実質的にそれを受け継いでいるものです。ただ、単にEU = Xe-Coreという関係性はなく、全くの別物と見たほうがいいでしょう。
Xe-Core
Xe-Coreの命令セットアーキテクチャ(ISA)は、様々なワークロードや製品に合わせてXe-Coreを柔軟に拡張することができるようにできています。一応、性能における最小単位ということになっているようです。詳細な情報はまだふせられているものの、Architecuture Dayで発表があったとおり、16基ずつ搭載されるベクトルエンジンと、マトリクスエンジンがXe-Coreには搭載されています。特に、マトリクスエンジンはXe Matrix eXtention(XMX)と呼ばれており、1024bit演算を行います。XeSSはこれをベースにしています。
Xe-Coreにはこれ以外にSaveとRestoreのおそらくAGUと、ローカルシェアドメモリ(LSM)、L1キャッシュが搭載されています。
Render Slice
Render Sliceは、Xe-Coreを4つ包括した上で、3Dグラフィックスを生成するために必要なレンダリングユニットが含まれています。
具体的には、4基のXe-Coreと、レイトレ用のアクセラレータ(Raytracing Unit)を4基、DirectX 12 Ultimateに対応するサンプラー、ピクセルバックエンド、ジオメトリ、ラスタライズパイプラインが搭載されています。レイトレーシングは、DirectX Raytracing(DXR)とVulkan Raytracingを完全にカバーしています。
実際のスケールでは、このRender Sliceの数を増減することによって、ラインナップを展開していくことになります。レンダースライス内のいくつかのXe-Coreを無効にするとか、そういうことをするのかどうかはまだわからず。もしもそれがないのであれば、最大8つのSKUでラインナップされることになります。
これらのRender Sliceは、広帯域のメモリファブリックに接続し、SoCあたり最大32基のXe-Coreで構成されます。
アーキテクチャとプロセス
Intelは、より高い性能と効率を実現するため、あらゆるレベルでアーキテクチャを改良し、論理設計・回路設計・ソフトウェアの改善、それとGPUに最適な特性を持つというTSMCの6nmプロセス「N6」プロセスで製造することにより、前世代より同じ電圧でのワットあたりの性能・クロックの両方で前世代(おそらくGen11 iGPU)と比べて50%も性能が向上したとのことです。
XeSS
Intelが、NVIDIAのDLSSや、AMDのFSRに対抗する技術として新たに発表したのが「Xe Super Sampling」(XeSS)というものです。
これは、AIをベースにしており、ある種のAIアクセラレーションということになっています。一応、ゲーミング用途ではDLSSやFSRと同様にアップスケーリング技術ということになっています。
XeSSは、隣接するピクセルだけでなく、動きを補正した前のフレームからの情報に基づいてサブピクセルの詳細を再構築し、時間的な認識を加えています。この処理は、高い性能と忠実性を実現するために訓練されたニューラルネットワーク上で行われ、Xe-Core内のXMXによって高速化されています。XMXがTensorコアに相当すると行っていいのかはわかりませんが、似たような感じになることは間違いないみたいです。
それに加えて、DP4a命令をベースにした追加のバージョンがIntelより発表されました。DP4a命令は、8bit整数のベクトル積和算命令で、このXeSSの追加バージョンは、DP4a命令をサポートするGPUなら、ArcだけでなくIntelで先行して登場しているXe GPU「Intel Iris Xe Max」GPUやTiger Lake/Rocket LakeのiGPUであるXe-LPと、競合他社のGPUでも使えるとしています。そしてXeSSは、こんにちのゲームエンジンに統合できるように設計されています。
話をまとめると、XeSSには、XMXをベースにしたものと、DP4a命令をベースにしたものという2つのバージョンが有り、XMX版は専用のアクセラレータが必要なためIntel Arcのみ対応、DP4a版はDP4a命令の対応するGPUならNVIDIAやAMD製品でも利用することができるということみたいです。
XMXをベースにしたバージョンのSDKは、今月からISV(開発者)に向けてリリースされ、DP4aのSDKは今年後半にリリースされる予定です。
DP4aをサポートするGPU
DP4a命令をサポートするGPUは、IntelはXeシリーズとNVIDIAのPascal(GP102/104/106)世代以降。AMDは公式なドキュメントからDP4a命令について見つからなかったので、Redditの書き込みベースの情報ですが、Vega 20とRDNA以降としています。つまり以下のGPUが対応するものと見られます。
DP4a命令をサポートしたすべてのGPUがXeSSをサポートするかどうかはわかりませんが、とりあえず。
長くなったので、畳んだ状態で表示します。開いてくんろ。
DP4a命令に対応するGPU
Intel
NVIDIA
- GeForce GTX 1060
- GeForce GTX 1070
- GeForce GTX 1070 Ti
- GeForce GTX 1080
- GeForce GTX 1080 Ti
- TITAN X
- TITAN Xp
- GeForce GTX 1650
- GeForce GTX 1650 Ti
- GeForce GTX 1650 Super
- GeForce GTX 1660
- GeForce GTX 1660 Ti
- GeForce GTX 1660 Super
- GeForce RTX 2060
- GeForce RTX 2060 Super
- GeForce RTX 2070
- GeForce RTX 2070 Super
- GeForce RTX 2080
- GeForce RTX 2080 Ti
- TITAN RTX
- GeForce RTX 3060
- GeForce RTX 3060 Ti
- GeForce RTX 3070
- GeForce RTX 3070 Ti
- GeForce RTX 3080
- GeForce RTX 3080 Ti
- GeForce RTX 3090
- Quadro GP100
- Quadro P6000
- Quadro P5000
- Quadro P4000
- Quadro P2000
- Quadro RTX 8000
- Quadro RTX 6000
- Quadro RTX 5000
- Quadro RTX 4000
- NVIDIA RTX A8000
- NVIDIA RTX A6000
- NVIDIA RTX A4000
- NVIDIA RTX A2000
AMD
- Radeon VII
- Radeon Pro VII
- Radeon Pro Vega II
- Radeon Pro Vega II Duo
- Radeon RX 6900 XT
- Radeon RX 6800 XT
- Radeon RX 6800
- Radeon RX 6700 XT
- Radeon RX 6600 XT
- Radeon RX 5700 XT 50th Anniversary Edition
- Radeon RX 5700 XT
- Radeon RX 5700
- Radeon RX 5600 XT
- Radeon RX 5600
- Radeon RX 5500
- Radeon RX 5500 XT
ドライバ
Intelは、MicrosoftのDirectX 12 Ultimateの開発に参加しているとしています。Intel Arcは、DX 12 Ultimateをすべてカバーしていることを既に明らかにしているためドライバもかなり重要です。DXRのレイトレーシングの他、可変レートシェーディング、メッシュシェーディングにも対応しています。
最近のIntelのグラフィックドライバは、CPU負荷の高いタイトルのスループットを向上させたり、シェーダーのコンパイルを強化してロード時間を短縮したり、100以上のゲームに影響を与える大きな変更を実施したりと、大きな成果を上げており、このままドライバも改良を続けていくことになるでしょう。
機能
ドライバには、NVIDIAのGeForce ExperienceにあたるGUI機能が十二分に用意されていて 強力なハードウェアエンコードを活用したキャプチャ機能や、AIのバーチャルカメラなどが搭載されています。また、AMDのソフトウェアのように、オーバークロック機能も統合されています。
今後の展開
Alchemist
今年の後半には、より詳しい情報が提供されるとのことです。
Alchemistの製品は来年初頭から登場する事になっており、おそらく一番初めにはハイエンドのものから登場するのでしょう。楽しみです。
Alchemist以降
そして、Alchemist以降は、Battlemage、Celestial、Druidという順番で展開されていきます。