DeepSeek の新モデルは思考でかなりの高得点を獲得

街に新しいモデルが登場し、業界内で注目を集めているが、ほとんどのアメリカ人はおそらくそのことを聞いたことがない。

DeepSeek は、専門家がクオンツ ヘッジ ファンドと表現する High Flyer Capital Management という会社によって開発された大規模な言語モデルです。この組織は、数多くの DeepSeek モデルとバージョンを作成しており、その一部は OpenAI などで開発中の最新モデルよりも優れたパフォーマンスを発揮します。

特に、DeepSeek R1-Lite-Preview と呼ばれる新しいモデルがあり、思考推論の連鎖時代が始まった現在、最も効果的なツールの 1 つとして、一部のアナリストから最高額の請求を受けています。

この DeepSeek モデルは思考の連鎖を表示し、ある種の論理推論、数学的推論、およびリアルタイムの問題解決タスクにおいて、OpenAI や Anthropic が提供できるものよりも優れたパフォーマンスを発揮します。

国内競技と国際競技

国内では、DeepSeek は Alibaba が開発した Qwen モデルと競合しています。昨日、高校の数学カリキュラムを使用してモデルをテストし、その能力を比較対照する MATH データ セットで Qwen がどのようにうまく機能するかについて報告しました。

DeepSeek-R1-Lite-Preview は、MATH データ セットやその他のプロンプトに関して、同種の他のモデルよりも優れたパフォーマンスを発揮すると特に評価されています。

国際的には、OpenAI や Anthropic などの企業がこの分野での優位性を維持しようとしています。しかし、私たちには次のような人々がいます。 ハギングフェイスのCEO、クレメント・デラング氏、 「(クウェンのモデルは)王様であり、中国のオープンモデルが全体的に優勢だ」と認めた。

そして、中国の AI グループ iFlytek の創設者、Liu Qingfeng 氏のような人物もいます。彼は、「米国と中国の差は、みんなが思っているほど大きくない。多くの分野では、我々 (モデル) の方が優れている」と述べたと伝えられています。彼らのものよ。」

テクノロジーメディアの舞台で多くの時間を費やしているオープンモデルに関する議論もあります。クローズド モデルはより安全ですが、オープン モデルはより平等です。

DeepSeek のモデルでできること

モデルがどのように他のモデルよりも優れているかについてのより直観的な詳細に興味がある場合は、「DeepSeek-R1-Lite-Preview が他のモデルよりも優れているのは何ですか?」と疑問に思うかもしれません。

Venture Beat のこの記事では、「イチゴという単語には R の文字が何個ありますか?」という質問を解決するモデルの非常に具体的な例を 2 つ示しています。そして、交互に数字の言葉で「9.11 と 9.9 のどちらが大きいですか?」

つまり、問題解決能力と論理的推論能力を示すような質問応答なのです。

具体的には、Venture Beat は、このモデルが MATH において OpenAI-o1-Preview レベルのパフォーマンスを超えていると報告しています。

その推論能力はその透明性のある思考プロセスによって強化されており、ユーザーはモデルが複雑な課題に段階的に取り組むのに従うことができます。

公平を期すために言うと、OpenAI の o1 プレビューも思考の連鎖を行います。私はそれを使ってみて、質問に答える途中で実行されているタスクを見て感銘を受けました。しかし、最も優秀な LLM が教室の先頭に立っているため、市場の状況を理解し、現在どのモデルが中心となっているかを理解することが重要です。

論理アプリケーションに関しては、これらすべての新しいモデルが幅広い分野の業界ツールに統合されているのが見られます。しかし、これはアナリストが現時点で言っていることの一部であり、彼らはまだベータ版であり、まだ非常に初期段階にあり、まだ私たちの世界に登場しつつあるモデルを評価しています。

出典

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください