ChatGPT メーカーの OpenAI は、新しい「12 日間の OpenAI」イベントを発表し、今後 2 週間、平日毎日新しいモデルまたは機能を公開します。
AI研究所は詳細については口を閉ざしているが、これには、誤った情報のリスクから運用コストに至るまで、さまざまな理由で隠されたままになっている、以前に示唆されたり明らかにされたりしたテクノロジーが多数含まれる可能性がある。
ソーシャル メディア上のほとんどの予測は、AI ビデオ ジェネレーター Sora、o1 推論モデルのフル バージョン、および音声エンジンを使用した ChatGPT Advanced Voice の音声制御の改善に関するものです。
CEO サム・アルトマン Xに書きました: 「平日は毎日、ローンチやデモ、大規模なものやクリスマスプレゼントなどを含むライブストリームを開催します。共有できる素晴らしいものをいくつか用意しています。楽しんでいただければ幸いです。メリークリスマス。」
OpenAI には何が期待できるのでしょうか?
12 日間。12 のライブストリーム。大小さまざまな新しいことがたくさんあります。明日から 12 日間の OpenAI が始まります。2024 年 12 月 4 日
OpenAI はこの 1 年間、まったく手をこまねいていたわけではありません。同社は昨年 1 月から GPT-4o、Advanced Voice、o1、ChatGPT Canvas などを出荷し、さらに多くの製品を発表しました。
考えられる発表
ソラ
o1モデル
高度な音声ビジョン
GPT-4o画像の生成
キャンバスのアップグレード
ChatGPT でのビデオ分析
音声検索
Sam-ta Clause が大きな赤いスーツを着ているように、今後 2 週間で私たちが目にすることになるのは、それらの発表の一部が私たちが使用できる製品になるということです。
OpenAI が「12 日間」のイベント中に発表できるすべてのことのうち、 ソラ おそらく最も期待されているものです。今では Hailuo MiniMax、Runway Gen-3、Kling などのモデルがあるため、6 か月前に比べてそれほどではありませんが、それでも大きな問題であり、最近のリークはそれが依然として世界のトップにあることを示していますゲーム。
推理の完全公開も期待 o1モデル。これにより、ChatGPT メモリ、GPT、ライブ検索データにアクセスできるようになり、プロジェクトの計画や複雑なアイデアの検討にさらに役立つようになります。
GPT-4oは可能です 画像を生成するしかし、これはOpenAIによってロックされているため、誰も使用できない機能です。これは今後 12 日間で利用可能になる可能性があります。この機能の初期のデモでは、印象的な結果と制御が示されていました。
Advanced Voice は強力ですが、改善の余地があります。これには、それを与えることも含まれる可能性があります ライブ検索アクセス などの機能があります。また、それができるかもしれません ウェブカメラを通して見てください または携帯電話のカメラを使用して現実世界の分析を提供します。
のアップデートが表示される可能性があります キャンバスこれには、チャット内でさまざまなキャンバス要素を積み重ねるなど、初期リリース時に示唆されていた機能が含まれます。 ChatGPT 内では、ベクター グラフィックスや、 ビデオ分析、ロックが解除され、チャットボットがさらに便利になります。
o2 や GPT-5o のプレビューなど、さらに多くの発表があるかもしれません。言語モデル以外では、Sora-Turbo と「Sora-full」が近々リリースされるだけになる可能性があります。さらに、OpenAI のテキスト読み上げツールである Voice Engine と、来年リリースされる予定の OpenAI の噂ではあるが未確認のエージェント フレームワークである「オペレータ」があります。
12 日間の OpenAI で何が発表されるにせよ、それは人工知能の新時代の幕開けとなるでしょう。これは Google Gemini の 1 歳の誕生日にも合わせて行われるため、私がホリデー シーズン向けの機能を準備しているのと同じ週に、Google からも発表があるのではないかと思います。スカイネットが必要なときはどこにありますか?