現在の人工知能チャットボットの構築は、市場を支配し自らを AI ブームの申し子。
しかし、これらのグラフィックス プロセッサ チップ (GPU) は、強力な AI システムをゼロから作成するのに非常に効果的であるのと同じ特性により、AI 製品を稼働させる効率が低くなります。
これにより、AI チップ業界は、AI ツールの日々の実行により適応し、膨大なコンピューティング コストの一部を削減するように設計された、いわゆる AI 推論チップの販売で Nvidia と競争できると考えるライバルに開放されました。生成AI。
ジョージタウン大学セキュリティ・新興技術センターのアナリスト、ジェイコブ・フェルドゴイズ氏は、「これらの企業は、その種の特殊なハードウェアにチャンスを見出している」と述べた。 「これらのモデルの採用が広がれば広がるほど、推論に必要なコンピューティング量が増え、推論チップに対する需要も高まります。」
AI推論とは何ですか?
AI チャットボットを作成するには、多くのコンピューティング能力が必要です。これは、AI システムが膨大なデータの山のパターンから「学習」するトレーニングまたは事前トレーニング (ChatGPT の「P」) と呼ばれるプロセスから始まります。 GPU は、相互に通信するデバイスのネットワーク上で一度に多くの計算を実行できるため、この作業を行うのに適しています。
ただし、生成 AI ツールはトレーニング後も、チャットボットにドキュメントの作成や画像の生成を依頼する場合など、その作業を実行するためのチップを必要とします。そこで推論が登場します。トレーニングされた AI モデルは、新しい情報を取り込み、すでに知っている情報から推論して応答を生成する必要があります。
GPU もその作業を行うことができます。しかし、それはナッツを割るために大ハンマーを使うのと少し似ているかもしれません。
「トレーニングをすると、より重く、より多くの仕事をすることになります。推論を使用すると、負担が軽減されます」と Forrester のアナリスト、Alvin Nguyen 氏は述べています。
これにより、Cerebras、Groq、d-Matrix などの新興企業だけでなく、AMD や Intel などの Nvidia の従来のチップ製造ライバルも、より推論に適したチップを売り込むようになり、Nvidia は自社のハイエンド ハードウェアに対する大手テクノロジー企業からの膨大な需要に応えることに重点を置いています。 。
AI推論チップラボの内部
今週最初の製品を発売するD-Matrixは2019年に設立されたが、同じシリコンバレーであるカリフォルニア州サンタクララの本社での最近のインタビューでCEOのシド・シェス氏が説明したように、AIチップゲームには少し遅かった。 AMD、Intel、Nvidia の本拠地でもある都市。
「すでに100社以上の企業が存在していました。それで、我々が現場に出たとき、最初に受けた反応は『遅すぎる』だった」と彼は語った。 6か月後にパンデミックが到来したが、テクノロジー業界はリモートワークに対応するソフトウェアに重点を置いた方向に舵を切ったものの、役に立たなかった。
しかし現在、シェス氏は AI 推論に大きな市場があると考えており、機械学習の後期段階を人間が学校で学んだ知識を応用する方法と比較しています。
「私たちは人生の最初の20年間を学校に通い、自ら教育することに費やしました。それが訓練ですよね?」彼は言いました。 「そして、人生の次の 40 年間は、現場に出てその知識を応用することになります。そうすれば、効率的に働くことで報酬を得ることができます。」
Corsair と呼ばれるこの製品は、それぞれ 4 つのチップレットを備えた 2 つのチップで構成されており、台湾積体電路製造会社 (Nvidia のほとんどのチップと同じメーカー) によって製造され、冷却を保つ方法でパッケージ化されています。
チップはサンタクララで設計され、台湾で組み立てられ、その後カリフォルニアでテストされます。テストは長いプロセスであり、6 か月かかることもあります。何か問題があれば台湾に送り返されることもあります。
D-Matrix の従業員は、ケーブル、マザーボード、コンピューターで覆われた青い金属製の机があり、隣には冷たいサーバー ルームがある研究室を最近訪れた際、チップの最終テストを行っていました。
AI 推論チップを欲しがる人はいるでしょうか?
Amazon、Google、Meta、Microsoft などの大手テクノロジー企業が AI 開発で互いに競い合い、高価な GPU の供給を食い荒らしている一方で、AI 推論チップのメーカーはより幅広い顧客層を狙っています。
フォレスター社のグエン氏は、その中には、独自のAIインフラを構築せずに新しい生成AI技術を利用したいフォーチュン500企業も含まれる可能性があると述べた。シェス氏は、AIビデオ生成に強い関心が寄せられると予想していると語った。
「こうした大企業の多くにとって AI の夢は、自社の企業データを使用できるようになることです」と Nguyen 氏は言います。 「(AI 推論チップの)購入は、Nvidia などから究極の GPU を購入するよりも安くなるはずです。しかし、それを統合するには学習曲線が必要になると思います。」
フェルドゴイズ氏は、トレーニング中心のチップとは異なり、AIの推論作業では人がチャットボットの応答をいかに早く得るかを優先していると述べた。
同氏は、別の企業全体が、大規模なデータセンターだけでなく、ローカルのデスクトップコンピュータ、ラップトップ、携帯電話上で実行できる推論用のAIハードウェアを開発していると述べた。
なぜこれが重要なのでしょうか?
チップの設計が改善されれば、企業の AI 運用にかかる巨額のコストが削減される可能性があります。それは他の全員の環境コストやエネルギーコストにも影響を与える可能性があります。
シェス氏は、現在の最大の懸念は、「人々がAGIと呼ぶもの、つまり人間のような知能を探求するために地球を焼き尽くすことになるのだろうか?」ということだという。
AI が汎用人工知能のレベルに到達するのがいつになるかはまだ不透明です。予測は数年から数十年と幅があります。しかし、シェス氏は、その探求に取り組んでいるテクノロジー大手はほんの一握りだと指摘する。
「でも、残りはどうするの?」彼は言いました。 「彼らを同じ道に置くことはできない。」
他のグループの企業は、非常に大規模な AI モデルの使用を望んでいません。コストがかかりすぎ、エネルギーの使用量が多すぎるためです。
「推論が実際にトレーニングよりもはるかに大きな機会になることを人々が本当に理解しているかどうかはわかりません。彼らはそれを高く評価していないと思います。あらゆる見出しを本当に賑わせているのは、やはりトレーニングだ」とシェス氏は語った。
—Matt O'Brien 氏と Barbara Ortutay 氏、AP テクノロジー ライター