一部の洞察力のある探偵によれば、ChatGPT の待望の視覚機能が間もなく登場する可能性があります。
Android 権限 最新の ChatGPT v1.2024.317 ベータ ビルドの高度な音声モード部分で、「ライブ カメラ」と呼ばれるものを指すコード行をいくつか発見しました。このコードは、「健康や安全に影響を与える可能性のあるライブナビゲーションや決定のために」ライブカメラを使用しないようユーザーに警告しているようだ。
コードの別の行には、「カメラ アイコンをタップして、ChatGPT で周囲の状況を表示およびチャットできるようにする」という視覚機能に関する指示が示されているようです。
マッシュ可能な光の速度
Windows および macOS 用 ChatGPT アップデート: 知っておくべきことすべて
ChatGPT の進化する機能: ビジョン、音声、その他
ChatGPT の情報を視覚的に処理する機能は、昨年 5 月の OpenAI イベントでデビューし、GPT-4o を発表した主要な機能です。イベントのデモでは、GPT-4o がモバイルまたはデスクトップのカメラを使用して被写体を識別し、ビジュアルの詳細を記憶する方法が示されました。ある特定のデモでは、GPT-4o がテニス ボールで遊んでいる犬を識別し、その名前が「クッパ」であることを思い出しました。
OpenAI イベントとそれに続く数人の幸運なアルファ テスターへの早期アクセス以来、ビジョンを備えた GPT-4o についてはあまり語られていません。一方、OpenAI は 9 月に ChatGPT Plus および Team ユーザー向けに Advanced Voice Mode を出荷しました。
コードが示すように、ChatGPT のビジョン モードが差し迫っている場合、ユーザーは、昨年の春に公開された新しい GPT-4o 機能の両方のコンポーネントを間もなくテストできるようになります。
ツイートは削除された可能性があります
OpenAI は、次のような報告にもかかわらず、最近多忙を極めています。 収益の逓減 将来のモデルとともに。先月、同社はAIモデルをWebに接続し、リアルタイムの情報を提供するChatGPT Searchを開始した。また、ユーザーに代わってコードの作成や Web の閲覧などの複数ステップのタスクを実行できる、ある種のエージェントを開発中であるとも噂されており、おそらく 1 月のリリースが予定されています。