RTX Blackwell の玉ねぎの皮をむく

データセンター AI アクセラレータでリードしているのと同じように、PC グラフィックス領域でも NVIDIA がリードしており、何年も何世代にもわたって製品が支配的です。同社が今年ラスベガスで開催された CES で、Blackwell GPU アーキテクチャをベースにした今後の GeForce RTX 50 シリーズ グラフィック カードを発表したとき、NVIDIA が競争力のある市場で最も強力な製品を提供できるかどうかについては、ほとんど疑問の余地がありませんでした。カードは今月下旬にゲーマーに発送されます。ただし、最初に発売された新しい GeForce RTX 5090 のパフォーマンスの詳細と微妙な全体像は、今日の禁輸解除まで待たなければなりませんでした。

それでは、これ以上の苦労はせずに、PC ゲーマー、愛好家、クリエイター向けの NVIDIA の新しい GeForce RTX 5090 Founders Edition グラフィックス カードをご紹介します。次に、その機能とそれに期待できるものを開梱しましょう。

GeForce RTX 5090 の内部: NVIDIA の RTX Blackwell アーキテクチャ

ここでは雑草の内容にはあまり深く立ち入りませんが、Nvidia が、フレーム生成を備えたディープラーニング スーパー サンプリングやニューラル シェーダーなどの高度なレンダリング テクノロジを可能にするために、RTX Blackwell GPU アーキテクチャをゼロから構築したと言っても過言ではありません。 AI によりシェーダーのビジュアルとパフォーマンスが向上しました。さらに、ブラックウェルの 4番目 世代レイ トレーシング コアは、メガ ジオメトリと標準ジオメトリのクラスターをより優れた忠実度と効率で処理できるように構築されています。番目 gen Tensor コアは、DLSS 4 および AI ワークロード全般のスループットを最大 2 倍にする FP4 精度をサポートするようになりました。

Blackwell ではシェーダー実行の並べ替えが最大 2 倍改善され、Nvidia の新しい GPU アーキテクチャも新しいメモリ コントローラーで強化され、32GB の GDDR7 メモリと組み合わせると、GDDR6 の 2 倍の最大 1.8TBps の帯域幅を提供します ( RTX 5090 の場合)、電力効率も向上します。最後に、ここでの私の短いリストがすべてを網羅しているわけではありませんが、NVIDIA の RTX Blackwell アーキテクチャのさまざまなブロックは、高度なクロック ゲーティング、パワー ゲーティング、電圧を備え、同社の前世代の Ada アーキテクチャよりもはるかに速く、より深いスリープ状態に入り、スリープ状態から復帰できます。レールゲート。実際、GPU がアクティブな間でも Blackwell のクロック ツリー全体を無効にできるため、メモリなどのボードの他の部分がアイドル状態であれば、さらに電力を節約できます。繰り返しますが、これらは RTX Blackwell の進歩のほんの一部ですが、さらに詳しく知りたい場合は、私の同僚に進んでください。 マルコの取材先 ホットハードウェア 完全なダウンロード用。

AI で強化され生成されたフレームが未来です。それに乗りましょう

このトピックについてはゲーム コミュニティで多くの議論が交わされているため、正面から取り上げてみましょう。 Nvidia は、GeForce RTX 50 シリーズ GPU のパフォーマンスについて大胆な主張を行っており、CEO のジェンスン ファン氏は、新しい 549 ドルの GeForce RTX 5070 と同社の 1599 ドルの前世代フラッグシップである GeForce RTX 4090 を比較し、同等のパフォーマンスを提供すると指摘しました。ここで注意しなければならないのは、新しい RTX 5070 は、そのチップ アーキテクチャだけでなく、マルチフレーム生成を備えた DLSS 4 などの新しい AI レンダリング技術によって実現される高度なテクノロジーによって、そのクラスのパフォーマンスを提供するということです。

簡単に言うと、Nvidia の前世代の DLSS 3 テクノロジーでは、ゲーム エンジンで AI が生成した 1 つのフレームをレンダリングできましたが、DLSS 4 では、ニューラル ネットワークが従来のレンダリングされたグラウンド トゥルース フレームの間に最大 3 つの追加フレームを生成できるようになりました。これにより、Blackwell に搭載された高度なディスプレイ エンジン フレーム ペーシングと合わせて、DLSS 4 対応の GeForce RTX 50 シリーズのパフォーマンスが、従来の GeForce RTX 40 ハードウェアの標準シングル フレーム生成と比較して大幅に向上します。もちろん、純粋主義者は「偽のフレーム」や、ゲームプレイで AI が生成した多数のフレームとの相互作用に伴う固有の遅延について議論するでしょう。 Nvidia の新しい Reflex 2 テクノロジーはフレームから反応までの遅延を軽減することを目的としていますが、ゲーム開発者はゲーム エンジンで DLSS 4 と Reflex 2 の両方のサポートを提供する必要があります。

発売時に Nvidia は、市場にはマルチフレーム世代で DLSS 4 をサポートするゲームが 75 あり、以前のバージョンをサポートする数百のタイトルと同様に、そのリストは時間の経過とともに増加するだろうとすぐに指摘しました。 DLSSの。ただし、繰り返しになりますが、コミュニティ内の一部の否定的な純粋主義者は、従来のレンダリングでは強引な馬力に代わるものはないと主張するでしょう。これは額面どおり真実ですが、問題は、レイ トレーシングやその他の高度なレンダリング効果を備えたゲーム エンジンがより洗練され、計算集約型になるにつれて、AI やその他のアルゴリズム アプローチによるレンダリング技術を進歩させずにシリコンを問題に投入すると、すぐに限界に達してしまうことです。収穫逓減点。

実際、PC グラフィックスの主要企業である AMD、NVIDIA、Intel との会話では、いずれも AI 支援によるフレーム生成が将来の進むべき道であると指摘しています。したがって、それは「かどうか」の問題ではなく、ゲーム開発者とゲーム コミュニティ全体が参加するときのことです。

GeForce RTX 5090 の高レベルのパフォーマンス プロファイル

Nvidia の新しい GeForce RTX 5090 のパフォーマンスの内訳は、従来のラスター パフォーマンス、超解像度とフレーム生成によるパフォーマンス、そしてもちろん非ゲーム アプリケーション向けの AI 推論と生成 AI パフォーマンスという 3 つの高レベルの角度からかなり明確に分割できます。コンテンツ制作も同様です。

コンテンツ作成に関して逸話的に言えば、GeForce RTX 5090 を使用したビデオ レンダリングの経験により、最終レンダリングのトランスコード時間が大幅に短縮されました。これは、GeForce RTX 5090 の追加エンコーダーがボードに搭載されているためです。 RTX 4090 には 2 つのエンコーダーがあり、RTX Blackwell 5090 には Nvidia の第 9 世代 NVENC をサポートするエンコーダーが 3 つあります。これで、AI スループットの健全性チェックを簡単に見てみましょう。

ML Commons は最近、広く尊敬されている Web サイトの PC クライアント バージョンをリリースしました。 MLPerf AI ベンチマーク。ここでは、GeForce RTX 5090 が前世代の 4090 兄弟を 38% 以上上回っていることがわかります。このトークン スループットの向上に加えて、最初のトークンまでの待ち時間も約 25% 短縮されたことにも注目してください。

次に、最先端のゲーム パフォーマンスを掘り下げてみましょう。まず、絶大な人気を誇るアクション RPG タイトル、サイバーパンク 2077 のウルトラ画質プリセットから始めます。

ここでは、GeForce RTX 5090 Blackwell の最大限の力が発揮されていることがわかります。上部の長いバーは​​、ゲーム内の 4X フレーム生成設定での最速の DLSS 4 レンダリング フレーム レートを表しています。この設定では、パフォーマンスを最大化するために、実際には 3 つの AI 生成フレームと 1 つのアップスケールされたフレームがレンダリングされます。 RTX 4090 の最速設定である DLSS と単一 AI フレーム生成を比較すると、RTX 5090 のパフォーマンスが 65% 以上向上しており、フレーム生成をオンにしていない前世代の GeForce RTX 4090 のパフォーマンスのほぼ 3 倍となっています。 。フレーム生成を完全にオフにした状態でパフォーマンスを見ると、RTX 5090 は 4090 より 22% 以上高速です。そして、AMD の最速 Radeon GPU は現在、FSR 3 超解像度が有効になっている状態では (フレーム生成がないため、Radeon では利用できません) 狩りの対象にもなっていません。このゲームタイトルでは)。

Formula 1 レーシング シム F1 24 では、GeForce RTX 5090 と前世代の RTX 4090 のパフォーマンスの差がより狭く、フレーム生成が有効になっている場合は約 37% 向上し、フレーム AI フレーム生成がない場合は 24% のエッジが見られます。また、このゲーム タイトルは、F1 24 が AMD Fluid Motion Frames フレーム生成技術をサポートしているため、Radeon RX 7900 XTX に対する AMD の最善の前進を示しており、RTX 5090 には及ばないものの、Radeon がスタックを大幅に上位に移動できるようになります。

モダンでゴージャスでグラフィックが豊かなゲーム タイトルに再び仕上がった Black Myth: Wukong は、完全なレイ トレーシングを採用した映画品質のプリセットで、すべての GPU 候補に間違いなく負担をかけます。ここで、新しい GeForce RTX 5090 は、フレーム生成をオンにした同様の設定で RTx 4090 よりも約 33% 高速ですが、フレーム生成をオフにすると、拡散は RTX 5090 の約 28% の優位性まで低下します。フレーム生成が有効になっているため、現在市場にある最速の Radeon カードは、このゲーム タイトルのこれらの設定ではプレイ可能なフレーム レートに達することさえできません。

ちなみに、HotHardware の豊富な機能を利用するには、必ず HotHardware を利用してください。 GeForce RTx 5090 によるベンチマーク、絵を完全に完成させます。

NVIDIA の GeForce RTX 50 発売に関する重要なポイントと将来の予測

Nvidia の新しい GeForce RTX 50 シリーズをめぐっては多少の論争があったと言っても過言ではありませんが、発売時の小売価格が 1599 ドルだった GeForce RTX 4090 に対して、RTX 5090 は 25% 値上がりして 1999 ドルとなった価格に関してはさらに大きな議論がありました。 。多くのゲーマーにとって 2,000 ドルのグラフィックス カードが高すぎることに疑問の余地はありませんが、市場で最も強力で機能が豊富な製品を簡単に入手でき、それを開発するために多大なエンジニアリング投資が必要な場合、主要な競合他社が不可能な価格でその製品を販売できるようになります。それはとても簡単です。

もう一度言いますが、GeForce RTX 5090 Founders Edition の価格だけに注目しているのであれば、的を外していると思います。 GeForce RTX Blackwell に対する Nvidia のエンジニアリング投資は、より低い、より主流の価格帯でも同様に効果を発揮します。

そして最終的には、そこがゴムと道路が出会う場所です。コミュニティの人々は、Nvidia の高価な新しいトップドッグ グラフィックス カードの利点について議論するでしょうが、RTX Blackwell がもたらす高度なレンダリング テクノロジと、それが可能にするパフォーマンスと視覚的な忠実度の利点について議論することはできません。 Nvidia CEO のジェンスン・フアン氏が、同社が今後発売する 549 ドルの GeForce RTX 5070 が前世代のトップエンド GeForce RTX 4090 と同じくらい高速になると述べたとき、それは同社がこれで提供した AI 支援レンダリング技術のメリットを説明するという特別な意図がありました。 PC グラフィックス カード、開発者ツール、およびソフトウェアのファミリー。

AI 生成コンテンツによる PC グラフィックスの進歩は自然な進化であり、Nvidia だけでなく業界全体が進む方向です。ただし、繰り返しになりますが、Nvidia は、この新たなイノベーションの道を切り開くために必要なエンジニアリングおよびソフトウェア サポートとともに、GPU アーキテクチャの最前線にも立っています。新しい GeForce RTX 5090 は、現在お金で購入できる最速の PC グラフィックス カードであり、何年も前に同社が基礎を築いた製品カテゴリとテクノロジーにおける同社の優位性を主張します。

出典