錦です。
数日前からまた「Nintendo Switch Pro」の話が出ていますが、その情報のおおもとはNVIDIAのリーク情報を取り扱っているkopite7kimi氏のツイートでした。正直次期Switch Proは正式リリースまで興味がないので、その手の話は別のメディアを参照してほしいのですが、単純に「T239」というSoC自体には興味があります。それ以外にもLinuxのカーネルにT239のサポートがコミットされているのが見つかりました。
This is a preliminary picture of T234 in Wikipedia. Very clear.
— kopite7kimi (@kopite7kimi) 2021年6月11日
So why do we always guess?
Nintendo will use a customized one, T239. pic.twitter.com/Qp5Im5udlQ
このツイートで表されているのはT234というSoC。GeForce Beyondで撮影したものを解析したものになっています。
Orin
この話をする前にOrinについてお話しておこうと思います。
NVIDIAはTegraと呼ばれるSoC製品をリリースしています。かつては搭載スマートフォンとか、Surdace RTなんかにも採用されたような製品だったのですが、現在ではその供給先はNVIDIA SheildやNintendo Switchにとどまっています。ただし、類似製品自体は数年前から存在していて、何かというと、AGXシステム向けのSoCです。これは、ロボットの制御やAIの学習などに用いることができるJetsonや小型PC(IoT)向けのSoCとなっており、更に現在は自動運転向けに強化されたSoCも存在しています。
で、そのOrinですが、今週開催されたGTC内で行われた「GeForce Beyond」という基調講演にて、実際の製品が登場しました。Orin AGXシステムがその最たる例です。
Orinは、Arm Cortex-A78AEがCPUとして最大12コア採用されています。A78とA78AEの違いは、国際規格に準拠する自動運転機能を持っているという事になっています。もともとOrin自体が自動運転向けのチップであるためです。といっても、自動運転以外にも利用できます。その例は前述のロボティクスやAI対応のミニPCが挙げられます。
そしてGPUには、Ampereベースのチップが採用されています。CUDA数が2048となっているようなので、16 SM相当となります。Orin最上位となるT234というSKUでは、単精度の理論性能が5.1TFLOPSとなっています。わかりやすく言うと、Apple M1 Proと同性能かつM1の2倍の理論性能です。
T239
T239はOrinラインナップの中の一つのSoCであると考えられます。おそらく、T239というのはGTCで発表された何かしらのOrinシステムとチップのことを指しており、Switch向けというのはその派生ということになるでしょう。これは既出のSwitch向けSoCと同様です。つまり、こちらのページで紹介されているSoCのどれか一つである可能性が高いです。
T239についての情報は一切明らかになっていませんが、CPUコアのみ8コアのCortex-A78AEが採用されるということがわかっています。これはLinuxカーネルへのコミットから判明したことです。カーネルのコミットでは、8コアで1クラスタとなっていますので、8コアずつスケールすることができるシステムが想定されているのかもしれません。
Orinは原則として、big.LITTLEをサポートしておらず、Cortex-A78AEのみでCPUが構成されています。Switchのようなモバイル型筐体Cortex-A7系統が8コア積まれることは私の記憶する中ではないので、T239はSwitch向けじゃない可能性があります(もちろん、クロックを落としたりすることでモバイル向けに最適化した電力で駆動することも可能だとは思いますが)。
ちなみに、Switchの現行SoCにはMarikoのT214というチップが用いられています。こちらは、MaxwellアーキテクチャのGPUと、Cortex-A57/A53がそれぞれ4コアずつのbig.LITTLE構成となっています。
ではGPUの規模はどれほどなのかというと、8コアCPUであるという情報と照らし合わせて考えるに「918MHzで駆動する1024 CUDAコア」あるいは「930MHzで駆動する1792 CUDAコア」となると見られます。もしSwitchに搭載されるとすれば、TDP的に考えて前者の1024 CUDA規模になるでしょう。理論性能は単純に半分として考えて2.55TFLOPS程度。これでも現行のSwitchより5倍あるし、Apple M1と同等なので性能がいいと思います。
1024 CUDAであるということは、8 SMと8 RT、32 Tensorコアを搭載していることになります。
もし任天堂が採用するとして
もし、T239を任天堂が採用したとしたらどのような仕様になるでしょうか。先述した8コアCPU・1024コアCUDAとは、あくまでT239の最大構成であり、実際にはコアを部分的に無効化して提供する可能性もあります。実際にEristaというコードネームで開発されたTegra X1では、T210というSoCでGPUを半分無効化したコアが存在しています。
ただし、Switchは無効化しない、あるいは無効化しても2SM程度にとどまると考えています。T239のTDP(恐らく消費電力も共通)は10~25Wであり、おそらくSwitchはこれに耐えうる電源を持っています。競合するハンドヘルドゲーム機がAMDやIntelの15W APU/CPUを用いていることも考えるとフル構成で搭載してくることも考えられます。
続いてメモリですが、T239のメモリ仕様はLPDDR5-6400・128bitとなる可能性が高いです。つまり、最大帯域は102.4GB/sと考えられます。現行のSwitchがLPDDR4(おそらく3200MHzよりも低クロック)であることを考えると2倍以上の帯域となり、ロード時間が大幅に短縮される可能性があります。
機能面
ここからは完全に私の予想です。
ついで機能ですが、DLSSに対応する可能性は部分的で、おそらくTVモードで4Kをサポートするために用いられる可能性があります。多分、GPUだけでも4Kゲームを遊ぶ程度の性能は持っていると思いますが、超解像度技術を用いている可能性があるゲームが現行モデルにあることを考えてもGPUのリソースを開放するためにDLSSが用いられる可能性があります。
また、NVIDIAはWindows向けですが、開発者による対応が不要な超解像度技術を有しています。これを用いる可能性もあります。
そしてレイトレーシングですが、これはSwitch Pro(仮称)でのみ有効になる機能として実装される可能性があります。Minecraftが似たようなレイトレーシングの実装をしていますし、PS5やPCとのクロスプラットフォームマルチプレイ対応ゲームではレイトレーシングをすでに他プラットフォームで開発済みのゲームもあります。Switchがおそらくこの輪の中に入るものだと思います。
ちなみに、現行のNVIDIAの超解像度技術・レイトレはx86プロセッサを要求していますが、すでにNVIDIAはArmプロセッサでレイトレやDLSSがゲームで動作することを明らかにしていますので、大した問題ではないでしょう。