- OpenAI は、ChatGPT の高度な音声モードで広く期待されていたビデオ機能を開始しました。
- これにより、ユーザーは ChatGPT を使用した会話にライブ ビデオや画面共有を組み込むことができます。
- ChatGPT は、感情を解釈し、宿題を支援し、リアルタイムの視覚的なコンテキストを提供できます。
ChatGPT の高度な音声モードは、自宅のリアルタイムの設計ヒント、数学の宿題の支援、またはメッセージ アプリからのテキストへの即時返信を提供できるようになりました。
5月のOpenAIのSpring Updateでテキストや音声とともにビジョンを「推論する」チャットボットの能力を垣間見せて世間をからかった後、同社はついに木曜日にOpenAIの「Shipmas」6日目の一環としてこの機能をローンチした。
同社は「本日、Advanced Voice でのビデオと画面共有の展開を開始できることを大変うれしく思います」と述べています。 言った 木曜日のライブストリームで。 「これには長い時間がかかることは承知しています。」
OpenAIは当初、音声とビデオの機能はSpring Updateから数週間以内に展開されると述べていた。ただし、アドバンスト音声モードは最終的に 9 月までユーザーに公開されず、ビデオ モードは今週まで公開されませんでした。
新しい機能は、ライブ ビデオと画面共有による「リアルタイムのビジュアル コンテキスト」を追加することで、ChatGPT との会話にさらに深みを与えるのに役立ちます。ユーザーは、ChatGPT アプリで[高度な音声モード]アイコンを選択し、左下のビデオ ボタンを選択することでライブ ビデオにアクセスできます。
木曜日のライブストリーム デモンストレーションでは、ChatGPT が OpenAI 従業員によるドリップ コーヒーの淹れ方を支援しました。チャットボットは従業員が何を着ているかなどの詳細を認識し、従業員に飲み物を飲ませる手順を案内し、質問に応じてプロセスの特定の部分について詳しく説明しました。チャットボットは彼のテクニックについてのフィードバックも与えました。
ChatGPT と画面を共有するには、ドロップダウン メニューをクリックして[画面を共有]を選択します。 「Shipmas」デモでは、ChatGPT はユーザーがメッセージ アプリを使用していることを識別し、送信されたメッセージを理解し、ユーザーの質問に対する応答の作成を支援できました。
同社の Spring Update 中に、OpenAI はビデオ モードの他の用途をいくつか披露しました。チャットボットは顔の表情に基づいて感情を解釈することができ、また家庭教師として機能する能力も実証しました。 OpenAI 研究リーダーの Barret Zoph 氏は、ホワイトボード上で方程式 (3x+1=4) を説明し、ChatGPT が x の値を見つけるためのヒントを彼に提供しました。
この機能には、Spring Update のデモンストレーション中に、従業員の 1 人を「木の表面」と呼んだり、表示される前に数学の問題を解こうとしたりするなど、いくつかのつまずきがありました。
この機能がリリースされたので、私たちはこの機能を試してみることにしました。そして今のところ、かなり印象的なものになっているようです。
私たちはチャットボットにオフィスの植物を見せ、それについて話してもらい、それが健康であるかどうかについての背景を与え、水やりのスケジュールがどうあるべきかを説明してもらいました。チャットボットは葉の先端の褐変と乾燥を正確に描写し、それをアロエベラ植物として識別しました。これは正しい説明に当てはまるようです。
新しいビデオ機能は、ChatGPT モバイル アプリの最新バージョンで今週、Team ユーザーとほとんどの Plus ユーザーおよび Pro ユーザーに公開されます。この機能はEU、スイス、アイスランド、ノルウェー、リヒテンシュタインではまだ利用できないが、OpenAIはできるだけ早く利用できるようになると述べた。