Sora は、2021 年にスタートアップ OpenAI によって作成された人工知能 (AI) ビデオ生成プログラムであり、現在は研究段階から移行し、Sora Turbo という新しい名前で正式に一般公開され、話題になっています。
このローンチはユーザーの間でオンラインの熱狂を引き起こし、同社は雪崩のようなトラフィックに圧倒されたことに気づき、新規アカウントの作成を一時的に停止した。
Sora は、ChatGPT などの他のコンテンツ作成プログラムと同様に、テキスト プロンプトを使用してコンテンツを作成します。書面による応答を生成する従来の AI プログラムとは異なり、Sora はユーザーのテキスト入力に基づいて高品質のビデオを作成します。
ソラはうんざりするほど良いです、gj @同じ
追加すると @everartai できるだけ早く画像に命を吹き込みましょう pic.twitter.com/wMehxOc8cm
— ジェイ A (@jay_azhang) 2024 年 12 月 9 日
12月9日のリリースに伴うOpenAIの声明によると、Sora TurboはオリジナルのSoraプログラムを改良したもので、より高速なビデオ作成、高品質のビデオ、およびユーザーがビデオをクリップして作成できる多数のビデオ編集機能を可能にします。シーケンスを作成したり、ビデオの他の部分を維持しながらビデオ内の要素を変更したりできます。
では、Sora Turbo とは一体何であり、ビデオ制作業界にどのような変化をもたらすのでしょうか?
ソラターボはどのように機能しますか?
Sora や他の多くの AI ビデオ ジェネレーターの力は、人間が高品質の撮影機材を使用して実行できることを、非常に短時間で再現できることです。
ユーザーは、ビデオに何を含めるかだけでなく、使用するカメラの種類、レンズの選択、照明の設定、視覚的な美しさ、構成、ストーリーボードについてもプログラムに指示を与えることができます。
これらの詳細の一部を使用したプロンプトの例は次のようになります。
「中望遠レンズ (85mm) を使用して、夜間に働く露天商の親密なポートレートを撮影します。ベンダー独自の暖かく輝く屋台のライトと背景の涼しい周囲の街の明かりを組み合わせてシーンを照らします。フレームと表情豊かな顔のバランスをとりながら、食べ物や商品を準備する売り手の手の細部に注目してください。このイメージは彼らの仕事に対する勤勉さと誇りを呼び起こすはずです。」
ソラターボはどれくらい優れていますか?
完璧ではありません。
ユーザーは生成したいビデオの種類についてテキスト プロンプトを書き、Sora がビデオを作成します。現在のリリースには制限があります。ビデオ品質は 30 フレーム/秒で最大 1080p で、長さは 20 秒のみです。
これは、マルチメディア アーティストであり、1980 年代の J-POP と SF のテーマにインスピレーションを得た音楽グループ、Satellite Young のリード シンガーである草名えみによる、Sora Turbo ビデオの例です。 1980年代。 20 秒の制限はありますが、Sora ストーリーボード機能を使用すると、以下のビデオに示すように、AI が生成した複数のビデオをつなぎ合わせて順番に配置できます。
一部のビデオには明らかなエラーも表示されます。たとえば、上のビデオでは、36 秒の時点で、ダンサーの 1 人が首を 180 度回転させますが、これはもちろん人間には不可能であり、ダンス ルーチンを続けます。同社はこのようなバグを解決するためにさらに努力する必要があると述べた。
OpenAIの創設者であるサム・アルトマン氏が2月に投稿した、料理をする女性のサンプルビデオでは、女性が混ぜるのをやめた後、右手に持っていたスプーンが消えることに視聴者は気づくだろう。
— サム・アルトマン (@sama) 2024 年 2 月 15 日
Sora Turbo は業界内でどのように受け入れられていますか?
一部の業界専門家やクリエイティブディレクターは、ソラが映画業界、特にハリウッドにどのような混乱をもたらすかを懸念している。
3月、あるハリウッド幹部は匿名を条件にアルジャジーラに対し、「これは制作に対する脅威ではなく、現在我々が知っている制作方法に対する脅威だと考えている」と語った。
彼は、人々がポストプロダクション会社にお金を払って作業を依頼するのではなく、個人のラップトップでビデオを編集するようになったなど、過去のポストプロダクションの実施方法の変化について言及しました。
「その移行期に多くの人々が命を落とした一方で、ポストハウスに要求される諸経費なしで突然適切な編集者を雇えるようになった人もいる」と彼は語った。
AIビデオジェネレーターはSoraだけですか?
いいえ、そうではありません。 AI ビデオ ジェネレーターの市場は日々成長しています。ただし、Sora と他の競合他社との明確な違いの 1 つは、Sora が生み出すことができる比類のないビデオ品質とリアリズムです。
さらに、新リリースの Sora Turbo には、映画、テレビ、オンライン コンテンツの作成で使用される 2 つの非常に人気のあるビデオ編集ソフトウェア プログラムである Adobe Premiere Pro または Final Cut Pro でユーザーが利用できる高度なビデオ編集機能が多数搭載されています。
さらに、Sora は巨大ソフトウェア会社 Microsoft から資金援助を受けています。 Microsoftはこれまでに140億ドル近くを投資し、1月23日には100億ドルの現金注入を行った。10月のCNBCによると、OpenAIは現在40億ドルの回転融資枠を持っており、その総流動性は100億ドル以上となっている。この額の投資により、Sora は他の多くの競合他社が持たないレベルの影響力を得ることができます。
他にどのようなビデオジェネレーターが利用可能ですか?
他にも次のような最上位の AI ビデオ ジェネレーターがいくつかあります。
滑走路第 3 世代
テクノロジー業界とベンチャーキャピタル業界をカバーする出版物「The Information」によると、2018年に設立されたRunwayは総額2億3,700万ドルの資金を調達しており、新たな資金調達に向けてベンチャーキャピタル会社ジェネラル・アトランティックと交渉中であると報じられている。 Runway Gen 3 の無料バージョンでは、720p の解像度、1 秒あたり 30 フレームで 10 秒のビデオ クリップを生成できます。有料加入者の場合、ビデオ クリップは 1440p または 2160p に設定できます。
Sora と同様に、テキスト プロンプトに基づいてビデオを作成できますが、短編ビデオ プロジェクトでは高速かつ効率的であるため、広告の作成に使用するソーシャル メディア クリエーターやマーケティング担当者に大きく依存します。
AI によって生成された長い形式のビデオの課題の 1 つは、生成された複数のビデオ間の一貫性です。長いビデオでは、すべてのビデオの見た目と雰囲気を同じにするために、インタラクティブなプロンプトの調整が必要です。
ブレードAI
Kuaishou が支援する Kling は、国際的には Kwai としても知られており、中国の北京に本拠を置く中国の大手テクノロジー企業です。 Klingは2024年6月に発表され、OpenAIのSoraなどのプラットフォームの競合他社としての地位を確立している。 Kling は、1080p の解像度、30 フレーム/秒で最長 2 分のビデオを生成できます。
ミニマックス
中国の AI スタートアップ企業である MiniMax は、中国に本拠を置く電子商取引、インターネット サービス、テクノロジー サービスを専門とする多国籍企業であるアリババ グループ ホールディングによって支援されています。アリババ グループの最新の資金調達ラウンドは 3 月に 6 億ドルでした。 MiniMax は、香港の沙田に拠点を置く大手 AI 企業 SenseTime の元従業員によって 2021 年に設立されました。
Minimax は、解像度 720p、毎秒 25 フレームで 6 秒のビデオ クリップを生成できます。