錦です。
3DCenterがNavi 31についてリークしています。
CU
まず、CUというものを説明しておきましょう。CUは、Compute Unitのことです。GPUは、命令キャッシュ、テクスチャ・L1キャッシュ、エクスチャマッピングユニットなどを含む、コンピューティングリソースの最小単位で構成されています。AMDの場合それがCUです。NVIDIAはSMと呼ばれていますね。
CUにはStreaming Processor(SP)も含まれており、CUがわかればSPがわかる、あるいはその逆がわかる、そして全てのコア数がわかるというような感じです。
WGP
単刀直入に言うと、Navi 31にはCompute Unitと呼ばれるものはなくなります。Workgroup Processor(WGP)がその代替(といっていいのか)となります。WGP自体はRDNA 2にも存在しており、RDNA 2では、2つのCUを1つのWGPとしていました。なので実際には、「CUという小規模な単位がなくなり、CUが2つ搭載されたWGPごとに数えられるようになった」というだけで、仕組み的には変わらないってことでいいんでしょうか(間違ってたらコメントください)。
で、話をRDNA 3(Navi 3x)にすると、WGAあたりのSP数が2倍となり、256コアになります。
そして、Navi 31にはダイあたり30基のWGPが搭載されているとのことでRX 7900 XTでは2ダイ、計15,360コアのSPが搭載される様子。CU換算では120.CUとなるわけですね
15360
— kopite7kimi (@kopite7kimi) July 22, 2021
kopite7kimi氏も同じことを言ってますね(というかkopite7kimi氏のほうが先行でしたね)。
チップレット
チップレットの話ですが、Navi 31とNavi 32はマルチチップレット構成、Navi 33以下はモノリシックであると言われています。つまり、RX 7900/7800シリーズはマルチ(おそらく2チップセット)、7700/7600/7500はシングルのチップレットになるみたい。
個人的に、7700にNavi 31かNavi 32のチップレットがモノリシックで搭載される可能性も考えられるともおもっていますが、その線はかなり薄いでしょう。
Infinity Cache
ついで、Infinity Cacheの話。
Navi31について、メモリ構成のリークは今の所ありませんが、Navi21と同様に256bitと予想されているというのが主流となっています。NVIDIAが384bitや320bitなどという大きな値なのにたいしてAMDは控え気味。16GBを超えないと考えられます。
ただ、AMDの切り札でもある「Infinity Cache」が増量され、192~256MB、512MBにも増えるのではないかとも言われています。Infinity CacheはそのままGPUの処理能力の向上に寄与していおり、AMDはCPU GPU通してキャッシュの増量を実施する予定です。
今回のリークでわかったことをまとめるとこんな感じになるみたいですね。
RX 6900 XT | RX 7900 XT | RX 7800 シリーズ |
RX 7700 シリーズ |
|
---|---|---|---|---|
コア | Navi 21 XTX | Navi31 | Navi32 | Navi33 |
トランジスタ数 | 268億 | |||
チップレット | 1 | 2 | 2 | 1 |
WGA数 | 40 | 60(30x2) | ||
SP数 | 5120 | 15360 | ||
ゲームクロック | 2015MHz | |||
ブーストクロック | 2250MHz | |||
メモリ | 16GB GDDR6 |
16GB? | 16GB | |
Infinity Cache | 128MB | ~512MB | ||
メモリバス | 256bit | 256bit | 256bit | |
帯域幅 | 512GB/s | |||
メモリ速度 | 16Gbps | |||
消費電力 | 300W | |||
リリース状況 | 発売済み | |||
価格 | 999ドル |
RDNA 3の性能の話
少し前にNVIDIAのAda LovelaceとHopperの関わりについてお話しました。そこで、GH202(Hopper)・AD102(Ada Lovelace)・Navi 31(RDNA 3)を比較したときに、AD102よりもNavi 31のほうが性能がいいことが明らかになっていました。
RDNA 3は、現行のNavi 21やGA102と比べて約2.5倍の性能を誇っています。Lovelaceはモノリシックであり、HopperとRDNA 3がマルチチップレットであるためRDNAのほうが性能が高くなっているのかと思いますが、一応RDNAの性能の話だけしておきました。まあ、NVIDIAはDLSS(Tensorコア)という奥の手を備えているので、実際のパワーバランスがどうなるかはわかりませんが。