Sony Interactive Entertainmentsは19日、11月に発売された「Play Station 5 Pro」に搭載されたGPUの詳細を明らかにしました。
PlayStation 5 Pro
動画に登壇したPlayStationのリードシステムアーキテクトであるマーク・サーニー氏は、まず、PlayStation 5 Proを発売する意義について述べ、そして、クリエイターについても述べました。同氏は、Proコンソールにクリエイターがなれるまで一定の時間がかかる、その上でクリエイターが極めて最小限の作業だけでProコンソールに対応できるようにする必要があると述べました。
2020年から計画されていたPS5 Proでは、「ビッグスリー」と呼ばれる3つの改善点を念頭に開発されています。これには「大型化されたGPU」「レイトレーシングハードウェアのアップグレード」「AIによるアップスケーリング」が含まれています。
GPUの大型化により、GPU自体の性能が底上げされ、PS5で動作するすべてのゲームの性能が向上します。
レイトレーシングハードウェアの更新によって、レイトレーシングの性能向上が達成され、かなりの速度向上につながっています。
そして、AIによるアップスケーリング。今回新たに搭載された機械学習用のカスタムハードウェアアクセラレータと、この上ので動作するPlayStation Spectral Super Resolution(PSSR)ライブラリとの組み合わせです。PSSRでは、ゲーム画像を解析することにより、画像の鮮明さや細部の再現度を大幅に向上するとしています。
高速化されたメモリ
PS5 Proでは、メモリも強化しています。サーニー氏は、PSSRの内部バッファに数百MBのメモリが必要であること、レイトレーシングの強化によるアクセラレーション構造にも数百MBのメモリが必要であること、そして言わずもがな高解像度をターゲットとしてるゲームでもメモリが必要です。特にPS5 Proは8Kもターゲットにしていますので、これは重要でしょう。
そこでPS5 Proでは、メモリの高速化と、実質的なメモリ増量を行いました。
メインメモリには引き続きGDDR6を採用しますが、速度は448 GB/sから576 GB/sに向上しています。さらに、PS4 Proと同様に低速RAM(DDR5)を追加し、OSの動作の大部分をそちらに移動することで従来より1GB以上GDDRメモリをゲームに割り当てることができるようになったということです。
RDNA 2.xを採用したGPU
前述のアップグレードを実現するために、PS5 Proには、AMDのカスタムAPUが搭載されています。
AMDのGPUでは、WGP(Workgroup Processor)という構成単位が用いられます。WGP 1基には2基のCompute Unit(CU)が搭載されています。PS5は18基のWGP(36 CU)となっていましたが、PS5 Proでは前述の通り大型化され30 WGP(60 CU)となっています。
GPUアーキテクチャは「Hybrid RDNA」とされています。このHybrid RDNAの内訳は「RDNA 2.x」アーキテクチャをベースに、レイトレーシングに「Future RDNA」、機械学習に「Custom RDNA」を採用するということです。つまり、「RDNA 2」技術のみで構成されたPS5に対して、PS5 ProではRDNA2系統のGPUと複数世代のコンポーネントを組み合わせたGPUとなっているということになります。
RDNA 2.x
サーニー氏は、RDNA 2.xについて、RDNA2とRDNA3の中間に位置するアーキテクチャだと説明しています。同氏は、RDNA 3にアップグレードするのではなく、部分的にRDNA 3を採用した事によって、PS5 Proにゲームを移植しやすくなると説明しました。
同氏は、PS5 Proのようなマイナーチェンジの場合、ゲームクリエイターはPS5とPS5 Proを1つのパッケージで包括できるようにする必要があると指摘。RDNA 2とRDNA 3ではシェーダープログラムの互換性もないことから、RDNA 3の技術を採用することでPS5 Pro向けにコンパイルしたゲームがPS5で動作しなくなるなどの問題のために、PS5とPS5 Proの両方のバイナリを生成する必要があります。
そこで、RDNA 3の要素を含んだRDNA 2ベースのアーキテクチャである「RDNA 2.x」を採用することにより、シェーダープログラムに互換性を持たせているということのようです。
RDNA 2.xに取り入れられたRDNA 3の要素としてRDNA 3のジオメトリパイプラインを採用したことによって、頂点処理やプリミティブ処理の一部の側面が高速化されていることを挙げています。
理論性能についても言及しました。同氏は、報道で指摘されているPS5 Proの理論性能 33.5 TFLOPS を明確に否定しました。この報道は、RDNA 2とRDNA 3での性能差から予測された結果となっていますが、前述の通りベース技術がRDNA 2であるため、理論性能についてはRDNA 2と同じであり、理論性能は18 WGPから30 WGPに増えた分(67%)のみの16.7 TFLOPSであると発表しました。
ただし、ゲームコンソールとしてTFLOPSという数字はあまり意味を持たないとも指摘しており、昨今の理論性能については「FLOPFLATION」という言葉を用いて皮肉を述べました。同氏は、GPUの強化に加え、メモリの高速化、ゲームエンジンとアーキテクチャの相性など多くの要素が影響すると指摘しています。その結果、1.45倍の性能向上と表現するのが現実的だとしました。
この数字は、レンダリング速度の向上を意味しており、この部分を活用してレイトレーシングの強化を行えるとしました。
レイトレーシングユニット
レイトレーシングについて「Future RDNA」と表現している通り、RDNA 3よりも先のアーキテクチャを使用しているとしています。おそらくRDNA 4と見られますが。
レイトレーシングについては、処理の効率化が行われているとしています。
まず、PS5並びにRDNA 2では、BVH4というアクセラレーション構造を採用していました。これは、1クロックサイクルで4つのボックスあるいは三角形の光線を処理できます。PS5 Proでは、BVH8に対応し、1サイクルで4つのボックスあるいは三角形の光線を処理できるようになっています。つまり、クロックあたりのスループットが2倍になっているということです。
更に、レイトレーシングでの分岐を最適化するためにSIMDで処理させる前処理についても効率化されており、複雑な分岐が必要となるレイトレーシング処理においてはハードウェアでスタック管理が行われるようになるため、シェーダコードが少なく単純なものになり、より効率的で高速化されたレイトレーシングの並列化が可能になります。
この複雑な分岐が発生するレイトレーシングは、平行する光線処理よりも曲線などに反射した際に多く発生するため、複雑な反射に対するレイトレーシング処理が大幅に効率化されました。
さらに、GPUの大規模化によってレイトレーシングのユニット自体も増えています。
これらによって、レイトレーシングの性能がPS5と比較して2倍から3倍になるケースも少なくないとのこと。
なお、この効率化されたレイトレーシングについてのみ、PS5用とPS5 Pro用で2つのシェーダープログラムが必要になるとしていますが、多くのゲームでは1つのプログラムのみになるとしており、最小限の変更で対応できるともしています。
機械学習
PS5 Proにおいて、明らかに最も注力されている分野は機械学習の部分です。SIEは、NPUの搭載ではなくGPUにAI用の機能を埋め込むことで機械学習の性能を底上げしました。
ハードウェア
サーニー氏は、PS5 ProのPSSRを実現するにあたって、GPUを強化するかNPUを追加するかの選択肢を天秤にかけ、GPUを強化するという選択に至ったと述べています。実際にこちらのメリットとして、前処理・後処理についてNPUは不向きであるとしているためです。
一方でGPUも汎用的な強化をするのではなく、特定のワークロードに特化した強化が必要だったと述べ、結果としてAMDのカスタムRDNAをGPU内部のAI用のアクセラレータに搭載したとしています。結果として、PS5 Proは300 TOPSのINT8演算性能を獲得し、これをPSSRに使いました。
しかし、次に300 TOPSという超高速な演算性能に対して、メモリ速度がネックとなると述べました。確かに、576 GB/sの帯域をもつGDDR6は高速ではあるものの、300 TOPSの演算性能を十分に発揮するためには数TB/s~数百TB/sという速度が必要であると指摘。
理想は、最初から最後までメインメモリへ読み書きはそれぞれ1回だけ済み、処理中のデータについては完全にオンチップメモリで行わせるというもの。しかし、オンチップメモリがCPUやGPUのキャッシュを指すものと考えていただければ分かる通り、ここに搭載できる容量は限られています。結論としては、容量・帯域双方に申し分ないチップ上のメモリを用意することが必要だということです。
最終的なアプローチとしては、WGPに4セットあるベクトルレジスタをメモリとして活用することにより、合計15MBで200 TB/s帯域のオンチップメモリを作ったということでした。この変更を活用するために44個の新しいシェーダー命令も追加したとのことです。
この44個の命令はINT8精度の演算となっている他、テイクオーバーモードとなっているため、複数層で構成される畳み込みニューラルネットワーク(CNN)に最適化されています。
またCNN自体に16-bit演算も必要であることから、16-bit演算命令もいくつか追加されており、結果としてカスタムRDNAが作られたということになるみたいです。
一方で、32-bit演算などについてはCNNの中で必要とされなかったのでカスタムRDNAの範疇外、つまり既存のRDNA 2の命令セットを用いるということになるのでしょう。
同氏は、今後の究極の目標としてすべての超解像度処理をメモリの読み書きを極限まで減らす「完全融合ネットワーク」を掲げています。
モデル
PSSRはPlayStation Spectral Super Resolutionですが、その中の一語でありライブラリの名称にもなっている「Spectral」という単語はあくまでもブランディングのためであり、意味はないとのこと。
基本的にPSSRの入力セットは、他社のFSRやDLSS、XeSSと共通となっており、使いやすいようになっていると指摘。一方で、PlayStationならではの要因や事情から、その中身自体は異なるものになっています。
PCゲームでは、レンダリング解像度が固定され、負荷に応じてフレームレートが変動します。一方で、テレビはその逆で、フレームレートが固定され、負荷に応じてレンダリング解像度が変動します。PCゲームの場合、レンダリング解像度が固定されているため、2:1の固定比率でアップスケーリングすることができますが、PS5 Proの環境では可変比率となります。
PSSRでは、レンダリング解像度が絶えず変動するシナリオを想定して設計・トレーニングが行われているとしています。ニューラルネットワークにはリカレントニューラルネットワークを採用しています。もちろん、PSSR以外の超解像度技術でも同様のシーンに対応していますが、PSSRとの違いはそこです。
モデルは、一部デベロッパーのベータリリースとその結果を基に繰り返し強化されており、結果は良好なものとなっています。
将来的な構想
サーニー氏は、"普段ほとんどしない"未来の話もしました。これは、ビッグスリーに書かがられた各要素の今後の可能性です。
まず、GPUの巨大化に関連するラスタライズレンダリングについて。これは、もはや成熟しきった分野であり、最適化よりもGPUやメモリの高速化による進化しか見込めない分野としました。
他方で、レイトレーシングは黎明期であり、今後10年で性能が飛躍的に向上する、いくつかの大きな進歩があると予想しています。
そして、言わずもがな機械学習についても大きな飛躍があると述べています。特に、同氏は完全融合ネットワークを目標として掲げています。
また、機械学習については、より少ないピクセルで豊かなグラフィックスが実現する超解像度技術を実現したいとしています。具体的には、1:2の比率で実現できることを1:3の比率で(3倍に)アップスケーリングする事ができるようにすることです。
さらに、CNNをはじめとした機械学習技術を、超解像度だけでなくレイトレーシングのノイズ除去など、他のターゲットにも応用したいとのこと。
AMDとの新たなパートナーシップ
機械学習の強化の一環でSIEはAMDとの新しい連携についても発表しました。このパートナーシップはSonyの青と、AMDの赤を混ぜた「Amethyst」と名付けられています。
このAmethystは2つの目標が掲げられています。
1つ目は、機械学習やAIに特化した新しいハードウェアアクセラレータの構築です。これは、完全融合ネットワークを実現することに重点をおいています。これは、AMDのロードマップと、SIEのPS5 Pro開発で得た知見を組み合わせて、ゲームだけでなく様々な分野で活用できるハードウェアアーキテクチャを実現するということのようです。
2つ目は、ゲーム向けに高品質なCNNのセットを並行して開発することとしています。
コンシューマ向けに来るかな・・・
PS5 Proは改めて、GPUの命令部分とベースは「RDNA 2」、処理系統が部分的に「RDNA 3」、レイトレーシングがおそらく「RDNA 4」、そしてAI部分がどのRDNAにも当てはまらないカスタマイズ設計となりました。ハイブリッドどころかRDNA 2~4の互換性と機能をいいとこ取りしたアーキテクチャである事がわかります。
レイトレーシングはまだしも、気になるのはカスタムRDNAです。300 TOPSの理論性能を持つというのは非常に気になるところ。RDNA 3のAI Acceleratorの理論性能が130 TOPS程度となっており、大幅な性能向上と見れます。
Amethystでの成果物は何らかの形でAMDの製品にも生かされると思いますが、これはRDNA 4に期待ですね。