OpenAIがついに始動 ソラ、テキストに基づいてビデオを作成する人工知能モデル。 CEOのサム・アルトマン氏が率いる同社は月曜日、この新しいツールはユーザーが作成するビデオに影響を与える可能性のある「多くの制限」を伴ってリリースされたと警告した。
サービスに月額 20 ドルを支払う ChatGPT Plus 加入者は、解像度 480p で最大 50 本のビデオを作成できるようになります。これらのビデオは最大 5 秒続きます。そして、月額 200 ドルの新しい ChatGPT Pro サブスクリプションの料金を支払った人は、「無制限の世代」を利用でき、解像度 1080p の 20 秒のビデオを作成できるようになります。
テキストのプロンプトだけでなく、Sora は「画像とビデオの入力」に基づいてビデオを作成することもできます。
しかし現時点では、「悪用の可能性」を理由に、実際の人物の写真やビデオに基づいて新しいビデオを作成できるのは一部のユーザーのみであるとOpenAIは月曜日に明らかにした。 OpenAIによると、同社は「安全性への取り組み」を確立するため、この試用期間中は子供の画像を使用して新しいビデオを生成することも許可されないという。
ここでは、Sora の Web サイトで OpenAI が共有している例をいくつか見ていきます。歩き回るクマのビデオのスクリーンショットと、光沢のある帽子をかぶった2人の老人のビデオのスクリーンショット:
OpenAI が初めて Sora を導入したのは 2 月に遡ります。月曜日の同社のYouTubeライブストリームによると、米国のユーザーと「海外のほとんどの国」で利用できるようになるが、英国やヨーロッパの他の地域でのリリースの予定は「ない」。
OpenAIはSoraのリリースを発表した月曜日のブログ投稿で、「私たちが導入しているSoraのバージョンには多くの制限がある」と述べた。 「多くの場合、非現実的な物理現象が生成され、長時間にわたって複雑なアクションに苦労します。 Sora Turbo は 2 月のプレビューよりもはるかに高速ですが、私たちはこのテクノロジーを誰もが手頃な価格で提供できるよう引き続き取り組んでいます。」
ブルームバーグは2月のレビューで、Soraには他のテキストからビデオへのAIモデルと同様、明らかな制約があると指摘した。 彼らは注目した ソラがどのように「迷っている体の部分と物理学の複雑な理解に苦しんでいるか」。
同社がテキストからビデオに変換する分野に正式に参入するには、かなりの競争が伴う。 GoogleがVeoモデルをリリース この分野の主要テクノロジー企業をいくつか挙げると、Meta は 10 月にテキストからビデオへの AI ツールを発表しました。テキストプロンプトに基づくオーディオおよびビジュアルコンテンツを専門とするStability AIも、ジェームズ・キャメロン氏が取締役会に加わった9月に信任投票を受けた。
新しいツールは次の URL で自分でチェックできます。 ソラ.com。