Googleディープマインド 発表された 月曜日(1月6日)、同社は「世界をシミュレートする」「大規模な」生成モデルに取り組むための新しいチームを創設すると発表した。これらのモデルは、意思決定、計画における人工知能 (AI) 機能の進歩の次の段階を表しています。 そして 創造性。
ワールド モデルは、AI システムが現実世界または仮想世界を理解してシミュレーションするのに役立つ計算フレームワークです。彼らは次の鍵となる 助ける AI システムに環境をナビゲートするよう教え、ロボット工学、ゲーム、自律システムに広く応用されています。
たとえば、自動運転車はこれらの世界モデルを使用して、交通状況や道路状況をシミュレートします。また、ジェネラリスト AI ロボットをさまざまな環境で訓練することもできます。共通の問題は、豊かで多様で安全なトレーニング環境が不足していることです。 いわゆる 具現化されたAI。
DeepMindの月曜日の求人情報には、AIモデルのスケーリングも技術の進化にとって重要であると記載されている。
「私たちは、ビデオとマルチモーダル データの事前トレーニングのスケーリングが汎用人工知能へのクリティカル パス上にあると信じています。世界モデルは、視覚的な推論とシミュレーション、具現化されたエージェントの計画、リアルタイムのインタラクティブなエンターテイメントなど、多くの分野を強化するでしょう」と求人情報には書かれています。 PYMNTS は Google に問い合わせましたが、まだ返答は得られていません。
ティム・ブルックス10月にOpenAIを離れてGoogle DeepMindに入社した同氏がチームを率いることになる。 OpenAI では、Brooks 氏は Sora の開発を共同で主導しました。Sora のビデオ生成モデルは、その洗練さのために発表されると急速に広まりました。
によると 仕事 リスト チームのために、新入社員は、Google の主力大規模マルチモーダル モデルである Gemini チーム、Veo (ビデオ生成モデル)、および Genie (ワールド モデル) チームの作業を「共同作業し、その上に構築」します。
Google DeepMind がワールド モデルに焦点を当てていることは、AI スタートアップ World Labs が昨年 9 月にステルスから脱却したときに述べたとおりです。このスタートアップは大規模な世界モデルを開発しています。スタンフォードAIのパイオニアが率いる フェイフェイ・リー、このスタートアップには、AIの先駆者でノーベル賞受賞者のジェフリー・ヒントン氏、SalesforceのCEOマーク・ベニオフ氏、LinkedInの共同創設者リード・ホフマン氏、元Google会長のエリック・シュミット氏のほか、アンドリーセン・ホロヴィッツ氏、NEA、NVentures氏などが資金提供している。
Google DeepMind は、Genie や Genie 2 を含むいくつかのワールド モデルをすでに開発しています。Genie 2 はテキストを変換し、 画像 この環境でのユーザーのアクションに応じて反応する 3D 世界に変換します。 (ジーニーは 2D 世界のみを作成しました)。
Genie 2 は、大規模なビデオ データセットから学習し、オートエンコーダーを通じてビデオ フレームをよりシンプルで意味のある表現に圧縮するプロセスを使用する強力な AI モデルです。これらの圧縮フレームは、ChatGPT などのテキスト生成モデルの動作と同様の方法を使用して、ビデオがどのように進行するかを段階的に予測するトランスフォーマー モデルによって分析されます。
大規模なビデオ データセットでトレーニングされた Genie 2 は、オブジェクトのインタラクション、複雑なキャラクター アニメーション、物理学 (重力や水しぶきの効果など) を表示できます。 そして 他のエージェントの行動モデリング。それが作り出す世界は最長 1 分間続きますが、ほとんどは 10 ~ 20 秒の範囲です。
Google DeepMind はワールド モデルへの重点を拡大し、OpenAI、Meta、Microsoft と競合する中で AI システムの機能をさらに強化します。 そして 企業にサービスを提供するアマゾン。
最新のイノベーションは、すでに豊富なイノベーションに加えられており、そのうちの 1 つは最近、 ノーベル賞にうなずく CEO向け デミス・ハサビス そして ジョン・M・ジャンパー:アルファフォールド2。それはAIモデルです。 予測された 既知のすべてのタンパク質の性質を明らかにし、50 年にわたる生化学の課題を解決します。
10月に発表された論文の中で、Google DeepMindの研究者らは 言った 彼らは、英国の小規模グループが英国の EU 離脱や移民などの物議を醸す問題について共通点を見つけるのを支援する AI 調停者として機能するように、ハーバーマス マシンと呼ばれる大規模な言語モデルをトレーニングしました。そのために、彼らの共通の視点を捉えた「グループ声明」を作成しました。