昨夜、Nvidia はついに RTX 50 世代グラフィックス カードを発表しました。しかし、休暇期間中、私は新しい GeForce RTX を搭載した PC で新しい DLSS 4 アップスケーリングとフレーム生成テクノロジをテストする時間を過ごす機会がありました。 5080、Cyberpunk 2077 の更新されたビルドを実行 – それは印象的です。 Nvidia は、超解像度アップスケーリングと光線再構成テクノロジーを新しい「ビジョン トランスフォーマー」モデルでアップグレードし、劇的な品質アップグレードを提供するとともに、フレーム生成が 1 つの補間フレームから 2 つ、さらには 3 つに強化されました。最終的には、120fps をはるかに上回るフレーム レートで完全なパス トレース エクスペリエンスを実行できる、より見栄えの良い Cyberpunk 2077 が実現しました。
ここで議論すべきことはたくさんありますが、明確にしておきたいのは、これはプレビュー、ファーストルックの報道です。私がアクセスできた RTX 5080 はエンジニアリング サンプルです。ドライバーは最終的なものではありません。 DLSS 4 がどのように動作し、大まかなフレーム レートが向上するかについては、大まかなアイデアを提供できますが、正確な数値はハードウェアと最終ドライバーのレビューを待つ必要があります。また、ハードウェアの使用時間は限られているため、実行できるテストの範囲は限られていますが、それでも、新しいテクノロジーに対する初期反応を得るのに十分な量を確認し、十分にキャプチャすることができました。
私の訪問の成果は下に埋め込まれていますが、キャプチャに関して言えば、以前の DLSS 3 フレーム生成と同様に、新しいフレーム生成システムのフレーム レート増幅率のせいで、DLSS 4 が実際にどのように見えるかを示すのはやや困難です。 。マルチフレーム生成により、DLSS 4 は QD-OLED 4K 240Hz モニターの最新波に適していますが、毎秒 240 フレームでウルトラ HD をキャプチャできるキャプチャ テクノロジは市場にありません。
ビデオの b ロールでは、120 fps に制限し、YouTube のトップエンド 4K 60 fps コンテナの制限内に収まるように 50 パーセント速度を落とすことで、フレーム生成の品質を示そうとしました。ただし、ロックを解除して実行すると、フレームレートは私が課した 120fps の制限よりもはるかに高くなります。したがって、ビデオでは新しいフレーム生成がどのように表示されるかがわかりますが、実際のエクスペリエンスはまったく異なります。フレームの持続性が大幅に低下するため、フレーム生成のアーティファクトははるかに目立たなくなります。実際、ビデオ プラットフォームであらゆる種類の代表的なメディアを提供するには、DLSS 4 を抑制する必要がありました。完全にマルチフレーム生成が有効になっている DLSS 4 は、最新世代の高リフレッシュ レート ディスプレイ向けに設計されており、私は完全にロック解除して実行されている Alienware AW3225QF QD-OLED 4K 240Hz モニターでそれを体験しましたが、それはまさにそのものでした。
ありがたいことに、DLSS 超解像度とレイ再構成の改善は 4K 60fps キャプチャで確認できます。ここには重要な改善点があります。既存の DLSS は畳み込みニューラル ネットワークを使用しています。NVIDIA は、これが「ローカライズされたコンテキストを分析し、連続したフレームにわたってそれらの領域の変化を追跡することによって新しいピクセルを生成する」と述べています。モデルは時間の経過とともに改善されてきましたが、限界までしか到達できず、最新のリリースでは反復的な改善のみが示されています。
新しい DLSS モデルは、ChatGPT、Gemini、Flux などの背後にある基本テクノロジーと同様のビジョン トランスフォーマーを使用します。 Nvidiaは、これにより「フレーム全体および複数のフレームにわたる各ピクセルの相対的な重要性を評価するためのセルフアテンション操作が可能になる」と述べている。以前の CNN モデルの 2 倍のパラメーターがあり、その結果、安定性の向上、ゴーストの低減、詳細の向上、アンチエイリアシングの強化が約束されています。トランスフォーマー モデルは拡張性が高いため、Nvidia はトレーニングを改善することで品質がさらに向上すると予測しています。また、下位互換性もあるため、2.0 バージョン以降で実行されている以前の DLSS タイトルに後付けすることもできます。 2018 年の Turing ベースの RTX 20 シリーズに遡る、以前のすべての RTX カードでも動作しますが、モデルの複雑さの増加により、ある種のパフォーマンスに影響が出る可能性があります (品質の向上によって相殺される可能性があります。これには徹底的なテストが必要です) )。
私たちがキャプチャした素材は限られていましたが、画質専門家の Alex Battaglia と私が B ロールから得た一般的な印象は、CNN パフォーマンス モードと同じ 1080p の内部解像度で実行しているにもかかわらず、ビジョン トランスフォーマーに相当するものはそうではないということです。そのように見えます – その方が良いです。また、DLSS に関して長年抱えていた問題の一部が大幅に改善されるという明らかな兆候がいくつかあります。これは上のビデオに最もよく示されていますが、スミアとゴーストが大幅に減少します。動きのきらめきやコンテンツの不要な「様式化」はほとんどなくなりました。一方、レイ再構成 (基本的にレイ トレーシング用のアップスケーリング) も同様の、非常に歓迎すべき改善を示しています。
ビジョン トランスフォーマー モデルを DLSS の既存の CNN バージョンと比較することは、本質的に 2 つの非常に異なる AI アップスケーラーを比較することになります。これは RTX 5080 で費やした時間の範囲をはるかに超えており、RTX 5080 を入手したら検討する予定です。ハードウェアは社内にあります。ただし、超解像度と光線再構成の改善による影響は重要です。 DLSS は、2020 年にバージョン 2.0 が登場して以来、改良を重ねてきただけですが、依然として最高品質のアップスケーラーであり続けていますが、DLSS レイ再構成は競合他社によってまだ提供されていません。両方の点でマイナス面のない劇的な改善がもたらされたと仮定すると、これにより Nvidia はライバルよりもさらに一歩先を行くことができます。
DLSS フレーム生成にも新機能が追加されましたが、これらは新しい RTX 50 シリーズ カードにのみ関連付けられています。 40 シリーズで使用されている単一生成フレーム生成技術は、50 シリーズでは 2 つおよび 3 つのフレーム生成で強化されています。これは、特に中間フレームをスムーズかつ一貫した方法でペーシングする場合には注意が必要です。そこで Nvidia は、新しい Blackwell アーキテクチャには均等なペーシングを確保するためのハードウェア コンポーネントが含まれていると述べています。
Cookie設定を管理する
私はテストのために石油化学スタジアムのブラック マーケットを使用しました。これは、サイバーパンク 2077 のコンソール バージョンでグラフィックスのボトルネックを特定するために以前に使用したエリアです。RT オーバードライブ パス トレース設定を有効にして 4K 出力解像度で完全にロック解除して実行すると、既存の単一フレーム生成技術と、超解像度および光線再構成のためのビジョン トランスフォーマー モデルを組み合わせると、ネイティブ 4K 解像度で実行されるゲームと比較して、フレーム レート乗数が 535 パーセント向上しました。より多くのフレームを生成するにつれて、ゲインは継続します。 2 つのフレームを追加すると 725 パーセントに増加しますが、3 つのフレームでは予測どおり最大の増加が得られ、ネイティブ解像度のレンダリングと比較して 913 パーセントになります。
フル フレーム生成とトランスフォーマー モデルが有効になっている RTX 5080 を、シングル フレーム生成と既存の CNN 超解像度/レイ再構成技術を備えた今後の 4080 Super と比較すると、フレーム レートが 91% 向上したことがわかりました。
フレーム ペーシングに戻ると、単一フレーム生成と完全な 3 フレーム生成出力を比較したフレーム時間の視覚化がいくつか表示されます。どちらも RTX 5080 で実行されています。後者は単にフレームが高速であることを意味するだけではないことがわかり、安心しました。レートだけでなく、よりスムーズなフレームレートも実現します。ここでは、Nvidia FrameView の新しいバージョンを使用してメトリクスを取得しましたが、FCAT で検証しました。FCAT では、ソフトウェアが GPU の出力に基づいてフレームの永続性を測定します。両方の結果が集計されました。
新しいフレーム生成技術に関する私の懸念は遅延でした。 DLSS 3 が開始されたとき、フレーム生成は、追加のフレームをバッファリングしてから中間フレームを計算することによって実現されました。これらの要因により遅延が増加しますが、貴重なミリ秒を取り戻すために Nvidia Reflex を必須に含めることである程度相殺されました。ビデオには、やはり FrameView で測定した PC 遅延の結果が含まれていることがわかります。ブラック マーケットでの約 2 分半の平均レイテンシは次のようになります。生成された 1 つのフレームでは平均レイテンシが 50.97 ミリ秒、生成されたフレームが 2 つでは 55.5 ミリ秒に増加し、3 フレーム全体では 57.3 ミリ秒になりました。オプション。
このサンプルに基づいて、フレームレートの 71% の増加と引き換えに、フレーム生成を最大化するとレイテンシーが平均 6.4 ミリ秒増加することがわかります。これは全体として公平な取引です。これらの結果を見ると、余分なレイテンシの大部分は依然としてその余分なフレームのバッファリングに起因しているように思えますが、さらに中間フレームを追加してもレイテンシの増加は比較的最小限に抑えられています。これは、サイバーパンクでもゲームプレイの応答性が依然として高く、入力ラグに非常に敏感でない限り、既存の DLSS フレーム生成ソリューションとの違いが分からないことを意味します。
当時、RTX 5080 で過ごした時間は有望なものでした。パス トレースされた Cyberpunk 2077 が、新しいフレーム生成オプションを使用して 1 秒あたり 120 フレームを大幅に超えて実行されているのは依然として非常に注目に値するため、それほど要求の厳しいゲームははるかに高速に実行される可能性があります。そして、フレーム生成が多くのゲームで CPU の制限を克服するのに非常に役立つことが証明されているという事実もあります。そこでマルチ フレーム生成が果たす役割を見るのは興味深いでしょう。一方、超解像度とレイ再構成の品質向上により、DLSS が現在最高品質のアップスケーリング ソリューションであるにもかかわらず、DLSS に関して抱えていた主要な懸念事項のいくつかが解決される予定です。
私たちは DLSS 4 のすべてのコンポーネントをできるだけ早く、さらに深くテストする予定です。そして、もちろん、すべての RTX 50 シリーズ GPU をやがてレビューする予定です。