Nvidia GeForce RTX 5090 と RTX 4090 — 新しい Halo GPU は以前の GPU とどう比較しますか?

Blackwell RTX 50 シリーズ GPU は、RTX 40 シリーズ Ada Lovelace GPU が 2022 年末に発売されて以来 2 年以上の長い待ち時間に終止符を打ちました。NVIDIA は、CES 2025 の基調講演中に今後の GeForce RTX 50 シリーズ カードを発表しました。仕様、価格、さらにはパフォーマンスのプレビューまで。大きな主張がなされ、DLSS 4 のような新しいテクノロジーがその主張に大きな役割を果たしました。新しい Halo 部分として、RTX 5090 は RTX 4090 を引き継ぎ、より多くのメモリ、より多くのコンピューティング、より多くの機能、およびより多くのパワーを誇ります。まだ利用可能ではありませんが、カードが発売される前に分析する価値のあることがたくさん起こっています。

RTX 5090 が登場したら、最高のグラフィックス カードの 1 つになるでしょうか? 「最高」が「最速」を意味するのであれば、はい、前作を超えることはほとんど疑いありません。 2倍の速さになるのでしょうか?パフォーマンスを測定したい方法にもよるかもしれませんが、これは従来のレンダリングとは異なる AI 技術に多大な信頼を置くことになります。 GPU の世界の新旧の王がどのように積み重なるかを議論するために、私たちが知っている仕様と機能を詳しく掘り下げてみましょう。

スワイプして水平にスクロールします
グラフィックスカード RTX5090 RTX4090
建築 GB202 AD102
プロセスノード TSMC 4NP TSMC 4N
トランジスタ (10億) 92 76.3
ダイサイズ(mm^2) 744 608.4
SMS 170 128
GPU シェーダー 21760 16384
テンソルコア 680 512
RTコア 170 128
ブーストクロック(MHz) 2407 2520
VRAM 速度 (Gbps) 28 21
VRAM (GB) 32 24
VRAM バス幅 512 384
L2キャッシュ 128? 72
レンダリング出力ユニット 240? 176
テクスチャ マッピング ユニット 680 512
TFLOPS FP32 (ブースト) 104.8 82.6
TFLOPS FP16 (INT8 トップ) 1676年? (3352) 661 (1321)
帯域幅 (GB/秒) 1792年 1008
TBP (ワット) 575 450
発売日 2025 年 1 月 2022 年 10 月
発売価格 $1,999 $1,599

まずは生のスペックについて話しましょう。 RTX 5090 には、4090 の 128 SM と比較して、170 の Blackwell ストリーミング マルチプロセッサ (SM) が搭載されています。これは、GPU コアが 33% 増加しており、CUDA コア、テンソル コア、RT コア、テクスチャ ユニットなどの数が直接関係しています。 SM カウントに換算すると、基本的には全体で 33% 増加することになります。

ただし、クロック速度も影響し、4090 は (計算と結果に基づいて) 比較して 2520 MHz のブースト クロックを備えています。 Nvidiaの公式スペック) 2407 MHz ブースト クロック。つまり、生のコンピューティングに関しては、5090 は「のみ」4090 よりも 27% 向上しています。ただし、これは他のアーキテクチャ上の違いが存在しないことを前提としており、これはほぼ確実に適切な仮定ではありません。

RTX 5090 では、GDDR7 とより大型で強化されたチップのおかげで、メモリ容量、速度、帯域幅がすべて向上しています。 RTX 5090 は 4090 よりも 33% 多くの VRAM を備え、クロックも 33% 高く、生の帯域幅が純 78% 向上しています。 L2 キャッシュのサイズや、帯域幅に影響を与える可能性のあるその他の変更があるかどうかはわかりませんが、これらは両方とも重要な考慮事項です。それでも、これは生のメモリ帯域幅の大幅な増加です。

Nvidia は RTX 50 シリーズで AI に大きな賭けをしており、そこに最大の変化が見られます。 RTX 4090 は、661 TFLOPS の FP16 テンソル計算 (スパーシティあり)、および 1321 TOPS (テラオプス) の INT8 テンソル計算 (これもスパーシティあり) を備えています。これは、123 TFLOPS / TOPS の FP16 / INT8 コンピューティング (スパースなし) しか提供しない AMD の RX 7900 XTX よりもはるかに優れています。しかし、それでも RTX 5090 と比較すると見劣りします。

FP16 の数値については確かではありませんが、Nvidia が前世代と同じ比率に従うと仮定すると、RTX 5090 は最大 1676 TFLOPS のテンソル FP16 コンピューティングを実現し、その 2 倍の 3352 TOPS のテンソル INT8 コンピューティングを実現します (どちらもスパース性あり)。 )。これは、新世代では AI の計算パフォーマンスが 154% (2.54 倍) 向上したことになります。そして Nvidia は、AI の可能性を有効に活用するつもりです。

(画像提供: Nvidia)

他の場所で説明したように、Nvidia DLSS 4 は Blackwell の新機能を活用して AI アルゴリズムを強化します。マルチフレーム生成は「将来を予測」し、レンダリングされた (および潜在的にアップスケーリングされた) 1 つのフレームから最大 3 つの追加フレームを生成します。補間ではなくフレーム投影を使用しているため、遅延ペナルティは DLSS 3 フレーム生成ですでに確認されているものとそれほど変わらないはずですが、追加のフレームによりすべてがよりスムーズに見えます。

それは実際にどのように感じますか?私たち自身でテストする機会がなかったので、最終的な判断は差し控えますが、かなり懐疑的です。おそらく正常に動作しますが、ユーザー入力に基づいてレンダリングされた 1 つのフレームに続いて、新しいユーザー入力なしで AI が生成した 3 つのフレームでは、すべてのフレームが新しいユーザー入力を取得して完全にレンダリングされるゲームと同じ感触はありません。

ただし、他の変更も予定されていますが、Blackwell RTX 5090 専用のものや、古い RTX カードで動作するものもあります。 RTX ニューラル マテリアルは、AI 圧縮と学習を使用して、ゲームで使用されるテクスチャとマテリアルの記述に必要なメモリ要件を約 3 分の 1 削減しているようです。ただし、これを機能させるには、ハードウェア パイプラインがシェーダーと一緒に AI を使用できる必要があるため、これも 50 シリーズ専用になります。

一方、DLSS Transformer のアップスケーリングでは、以前の DLSS アップスケーリング アルゴリズムで使用されていた畳み込みニューラル ネットワーク (CNN) ではなく、AI トランスフォーマーから構築された新しくトレーニングされたネットワークが使用されます。トランスフォーマーは AI 革命の中心であり、ChatGPT、DALL-E、その他の AI コンテンツ ジェネレーターなどを動かしています。 Nvidia が示した新旧の DLSS アップスケーリングのサンプル ビデオは非常に印象的で、私たちは実際に試してみたいと考えています。さらに、新しい DLSS Transformer アルゴリズムは明らかに古い CNN バージョンよりも高速に実行され、すべての RTX GPU で利用できるようになります。

Nvidia 独自のパフォーマンス プレビューでは、RTX 5090 が RTX 4090 の最大 2 倍の速度になる可能性があることを示唆していますが、DLSS 4 が存在せず、場合によっては DLSS 3 さえ存在しないゲームもいくつか示されています。 Far Cry 6 の結果を見ると、新しい AI 機能が方程式に含まれていないゲームでは、5090 は 4090 よりも約 27% 高いパフォーマンスを提供するようです。 「A Plague Tale: Requiem」では、そのギャップは約 43% まで増加します (はい、ピクセルを数えています!)。 DLSS 4 MFG (DLSS 3 FG と比較) を使用するゲームでは、Nvidia は 2.3 ~ 2.45 倍の向上を示しています。

ということは、RTX 5090には高い価格の価値があるのか​​、それとも価値がないのか?それは主にあなたが何をしているかによると思います。 AI に興味を持ち、RTX 5090 に 1,999 ドルを支払うチャンスに飛びつく人や企業はほぼ間違いなく存在するでしょう。これらの同じグループが過去 2 年間、RTX 4090 カードを購入しています。生成 AI テストでは、5090 は Flux.dev を使用してパフォーマンスが 2 倍に大幅に向上したことも示しました。

しかし、主にゲームをプレイしていて、フレーム生成が好きではない場合はどうでしょうか?しばらく座って事態の推移を待つのも悪くないかもしれません。おそらく、DLSS 4 を実際に使用すると、見た目も使い心地も素晴らしいものになるでしょう。あるいは、新しい 16 ピン コネクタを介して最大 575 W の電力を引き出すと、Meltgate Part 2 が実現するかもしれません。しかし、どう考えても、ゲーム用 GPU に 2 グランドは大金です。そして、残りは間違いなく欲しくなるでしょう。 RTX 5090 に電力を供給し、ゲームのアップデートを安定して提供するには、非常に強力な PC が必要となるため、このタスクを実行するには PC の性能が必要です。

出典