Google は、新しい「推論」AI モデルと呼ぶものをリリースしました。しかし、これは実験段階にあり、私たちの簡単なテストから、改善の余地があることは確かです。
Gemini 2.0 Flash Thinking Experimental (確かに一口ですが) と呼ばれるこの新しいモデルは、Google の AI プロトタイピング プラットフォームである AI Studio で利用できます。モデルカードには、これが「マルチモーダルな理解、推論、コーディングに最適」であり、プログラミング、数学、物理学などの分野で「最も複雑な問題を推論する」能力があると説明されています。
で 役職 AI Studio の製品をリードする Logan Kilpatrick 氏は、X について、Gemini 2.0 Flash Thinking Experimental を「(Google の)推論の旅の最初のステップ」と呼んでいます。 GoogleのAI研究部門、Google DeepMindのチーフサイエンティスト、ジェフ・ディーン氏はこう語る。 言った 彼自身の投稿では、Gemini 2.0 Flash Thinking Experimental は「推論を強化するために思考を使用するように訓練されている」と述べています。
「推論時間の計算量を増やすと、有望な結果が得られます」とディーン氏は、質問を検討する際にモデルを「実行」するために使用される計算量について言及しました。
これはまだ初期バージョンですが、視覚的手がかりとテキスト手がかりの両方を含む難しいパズルをモデルがどのように処理するかを確認してください: (2/3) pic.twitter.com/JltHeK7Fo7
— ローガン・キルパトリック (@OfficialLoganK) 2024 年 12 月 19 日
Google が最近発表した Gemini 2.0 Flash モデルに基づいて構築された Gemini 2.0 Flash Thinking Experimental は、OpenAI の o1 やその他のいわゆる推論モデルと設計が似ているようです。ほとんどの AI とは異なり、推論モデルは効果的に事実確認を行うため、AI モデルが通常つまずく落とし穴のいくつかを回避できます。
欠点として、推論モデルは解決策に到達するまでに時間がかかることが多く、通常は数秒から数分長くなります。
プロンプトが与えられると、Gemini 2.0 Flash Thinking Experimental は応答する前に一時停止し、関連する多数のプロンプトを検討し、途中でその理由を「説明」します。しばらくすると、モデルは最も正確な答えであると考えられるものを要約します。
まあ、それが起こるべきことです。 Gemini 2.0 Flash Thinking Experimental に「イチゴ」という単語に R が何個あるか尋ねると、「2 つ」と答えました。
走行距離は異なる場合があります。
o1 のリリースを受けて、Google だけでなく、ライバルの AI ラボによる推論モデルが爆発的に増加しました。 11 月初旬、クオンツトレーダーから資金提供されている AI 研究会社 DeepSeek は、最初の推論モデルである DeepSeek-R1 のプレビューを開始しました。同月、アリババのクウェンチームは、o1への最初の「オープンな」挑戦者であると主張するものを発表した。
ブルームバーグ 報告されました 10月、Googleは推論モデルを開発する複数のチームを抱えていたと発表した。その後 報告 11月のThe Information誌によると、同社にはこの技術を専門とする少なくとも200人の研究者がいるという。
何が推論モデルの水門を開いたのでしょうか?その 1 つは、生成 AI を改良するための新しいアプローチの探索です。最近私の同僚のマックス・ゼフとして 報告されましたモデルをスケールアップする「強引な」手法では、かつてのような改善が得られなくなりました。
誰もが推論モデルが最善の道であると確信しているわけではありません。たとえば、それらを実行するには大量のコンピューティング能力が必要なため、高価になる傾向があります。そして彼らがそうしている間に 実行されました 順調です ベンチマーク これまでのところ、推論モデルがこの進歩速度を維持できるかどうかはかなり明らかです。