Amazon Web Service(AWS)は、年次イベント「AWS re:Ivent 2023」にて、AWSで展開するArmベースのCPU「Graviton4」とAIアクセラレータ「Trainium2」をそれぞれ発表しました。
Graviton4
Graviton4は、第4世代のGraviton製品です。このブランドでは、ArmのIPを採用しています。前世代Graviton3ではNeoverse V1が採用されていましたが、今回はそれを強化したArmv9.0-A ISAベースのNeoverse V2を採用しています。
最大コア数は64コアから96コアに増加しており、コアあたりの2MBのL2キャッシュを備えています。
そして、メモリは12チャネルのDDR5-5600となっており、8チャネルから増えたため帯域が向上しています。容量についてはメモリは75%増加しているとしています。
これらの結果として、データベースの性能で最大40%、Webアプリケーションで最大30%、大規模Javaアプリケーションで45%高速であるとし、平均として30%の性能向上をアピールしています。
Graviton4は、R8gインスタンスで利用できます。R8gインスタンスはプレビューで公開された後、数ヶ月以内に正式に提供する予定です。Graviton3を搭載しているR7gの最大3倍のvCPU数と、3倍のメモリ容量を備えているとしています。
Trainium2
Trainium2は、AWSのAIアクセラレータです。AWSはTrainiumの他にInferentiaというAIアクセラレータを投入していますが、Trainiumはトレーニング用のアクセラレータ、Inferentiaは推論用のアクセラレータとなっています。
Trainium2は、第2世代のTrainiumです。前世代に比べて、性能が4倍、メモリ容量が3倍、電力効率は2倍になっているようです。
パッケージはマルチチップレット構造の様になっているそう。
Trainium2はTrn2インスタンスで提供され、2024年からの提供になるとしています。現時点では、これ以上の情報はわかっていません。