- bytedanceは、新しいOmnihuman AIビデオモデルを披露しています。
- Omnihumanは、単一の写真をリアルなフルボディビデオに変えます。
- ビデオは、現実的な歌、話し、動きを示しています。
Tiktokの親会社であるBytedanceは、1枚の写真から話したり、歌い、動き回ったりする人々の鮮明なビデオを作成できる新しいAIビデオ作成者を披露しています。新しいOmnihumanモデルは、不気味に正確な体の動き、表情、ジェスチャーでイメージを実現することができます。
Omnihumanのブレークスルーには、18,700時間以上のビデオでのトレーニングが含まれていました。 AIは、ビデオで人間がどのように動き、話し、相互作用するかを模倣することができます。特に、このAIは、顔や上半身をアニメーション化するのではなく、完全に動くキャラクターを作成できます。つまり、単一の写真を、スピーチをしたり、踊ったり、楽器を演奏したりする人のビデオに変えることができます。
その結果、キャラクターが写真からの人間であろうと、より様式化された絵画の人間であろうと、非常に現実的なビデオです。以下の例を見ることができます。
どこでもオムニフマン
bytedanceがOmnihumanを利用可能にする場合、Tiktokで爆発することを想像するのは簡単です。同社はすでにプラットフォームでJimengという名前のAIビデオメーカーを提供しており、Omnihumanのようなものは、Tiktokやその他の機能でより多くの人々を誘惑するように誘惑する可能性があります。
もちろん、bytedanceは競争なしにスペースに入ることはありません。 OpenaiのSoraは称賛を引き出し、AIビデオスペースに大きな名前ですが、Pika、Runway、Pollo、Luma LabsのDream Machineなど、他にもたくさんあります。
より多くの映画のために過去の俳優を再現するか、歴史上の人物の模擬口から生徒の歴史を教えるかどうかにかかわらず、バイテダンスのモデルには多くの潜在的な使用があります。ソーシャルメディアやゲーム用のデジタルアバターでさえ、よりリアルになり、ユーザー入力に基づいてリアルタイムで適応する可能性があります。
Omnihumanは今でも研究プロジェクトですが、条例がすでにその能力を紹介しているという事実は、実際のアプリケーションがそれほど遅れていないことを示唆しています。以下のAI文字は、Tiktokのビデオトレンドの次の顔になる可能性があります。