OpenAIは、ビデオ生成AIであるSoraのトレーニングにどのデータを使用したのかを正確に明らかにしていない。しかし、見た目からすると、少なくともデータの一部は Twitch ストリームやゲームのウォークスルーから取得したものである可能性があります。
Sora は月曜日にリリースされ、(容量の問題が許す範囲で)少し遊んでいます。 Sora は、テキスト プロンプトまたは画像から、さまざまなアスペクト比と解像度で最大 20 秒の長さのビデオを生成できます。
OpenAIが2月にSoraを初めて公開したとき、それはモデルをMinecraftのビデオでトレーニングしたという事実をほのめかした。そこで私は、トレーニング セットには他にどのようなビデオ ゲームのプレイスルーが潜んでいるのだろうかと考えました。
かなりの数のようです。
Sora は、本質的にスーパー マリオ ブラザーズのクローンであるもののビデオを生成できます (不具合がある場合)。
Call of Duty や Counter-Strike にインスピレーションを得たような一人称シューティング ゲームのゲームプレイ映像を作成できます。
そして、90 年代のティーンエイジ ミュータント ニンジャ タートル ゲームのスタイルでアーケード ファイターを示すクリップを吐き出すことができます。
ソラはまた、Twitch ストリームがどのようなものであるべきかを理解しているようで、いくつか見たことがあるということを示唆しています。大まかなストロークを正確に把握している以下のスクリーンショットをチェックしてください。
スクリーンショットに関するもう 1 つの注目すべき点は、Auronplay という名前で知られる人気 Twitch ストリーマー、Raúl Álvarez Genes の肖像が、Genes の左前腕のタトゥーに至るまで見られることです。
Sora が「知っている」と思われる Twitch ストリーマーは Auronplay だけではありません。これは、Pokimane としてよく知られる Imane Anys に外観が (芸術的自由度はあるが) 似たキャラクターのビデオを生成しました。
確かに、いくつかのプロンプト (「イタリアの配管工ゲーム」など) については創造性を発揮する必要がありました。 OpenAI は、Sora が商標登録されたキャラクターを描いたクリップを生成しないようにフィルタリングを実装しました。たとえば、「Mortal Kombat 1 gameplay」などと入力しても、タイトルに似た内容は表示されません。
しかし、私のテストによると、ゲームのコンテンツがソラのトレーニング データに侵入している可能性があります。
OpenAIはトレーニングデータをどこから取得するかについては慎重だった。で インタビュー 3月にウォール・ストリート・ジャーナル紙に寄稿したところ、OpenAIの当時のCTOミラ・ムラティ氏は、SoraがYouTube、Instagram、Facebookのコンテンツで訓練を受けていたことを完全には否定しなかった。そして、 技術仕様 Sora について、OpenAI は、Sora の開発に「公開されている」データと、Shutterstock などのストック メディア ライブラリからのライセンス データを使用したことを認めました。
OpenAIもコメント要請に応じなかった。
実際にゲーム コンテンツが Sora のトレーニング セットに含まれている場合、特に OpenAI が Sora の上にさらにインタラクティブなエクスペリエンスを構築する場合、法的影響が生じる可能性があります。
「ビデオゲームのプレイスルーの無許可映像を使ってトレーニングを行っている企業は、多くのリスクを抱えています」とプライアー・キャッシュマン社の知財弁護士、ジョシュア・ワイゲンスバーグ氏はTechCrunchに語った。 「生成 AI モデルのトレーニングには通常、トレーニング データのコピーが含まれます。そのデータがゲームのプレイスルービデオである場合、著作権で保護された素材がトレーニング セットに含まれている可能性が圧倒的に高くなります。」
確率モデル
Sora のような生成 AI モデルは確率的です。大量のデータでトレーニングされた彼らは、そのデータのパターンを学習して予測を行います。たとえば、人がハンバーガーをかじると噛み跡が残るなどの予測を行います。
これは便利なプロパティです。これにより、モデルは世界を観察することで、世界がどのように機能するかをある程度「学習」できます。しかし、それはアキレス腱になることもあります。特定の方法でプロンプトが表示されると、モデル (その多くは公開 Web データでトレーニングされています) はトレーニング サンプルのほぼコピーを生成します。
このことは当然のことながら、無断でトレーニング中に作品を流されてしまったクリエイターたちを不快にさせます。裁判制度を通じて救済を求める人が増えています。
Microsoft と OpenAI は現在、 訴えられた AIツールにライセンスされたコードの逆流を許可した疑いがある。人気の AI アート アプリを開発する Midjourney、Runway、Stability AI の 3 社が、アーティストの権利を侵害したとして告発される訴訟の焦点となっている。また、大手音楽レーベルは、AIを活用した楽曲生成装置を開発している新興企業2社、UdioとSunoに対して著作権侵害で訴訟を起こしている。
多くの AI 企業は長い間フェアユースの保護を主張し、自社のモデルは盗作ではなく革新的な作品を生み出すと主張してきました。たとえば、スノ氏は、無差別トレーニングは「そのジャンルを聞いて自分でロックの曲を書く子供」と何ら変わらないと主張する。
しかし、ゲームコンテンツには特有の考慮事項があると、ドーシー&ホイットニー社の著作権法を専門とする弁護士エヴァン・エベリスト氏は言う。
「プレイスルーのビデオには、少なくとも 2 つの著作権保護層が含まれます。ゲーム開発者が所有するゲームのコンテンツと、プレイヤーまたはビデオ撮影者が作成してプレイヤーの体験をキャプチャした独自のビデオです」と Everist 氏は電子メールで TechCrunch に語った。 「また、一部のゲームでは、ソフトウェアに表示されるユーザー作成コンテンツの形で権利の第 3 層が存在する可能性があります。」
Everist は、プレーヤーが独自のゲーム マップを作成し、他の人が使用できるように共有できる Epic の Fortnite の例を挙げました。これらのマップの 1 つをプレイスルーしたビデオには、(1) エピック、(2) マップの使用者、(3) マップの作成者という少なくとも 3 人の著作権所有者が関与することになる、と同氏は述べました。
「裁判所がAIモデルのトレーニングに対する著作権責任を認めた場合、これらの著作権保有者はそれぞれ原告またはライセンス供給源となる可能性がある」とエベリストは述べた。 「このようなビデオで AI をトレーニングしている開発者にとって、リスクにさらされるリスクは指数関数的に増大します。」
ワイゲンスバーグ氏は、ゲーム自体には独自のテクスチャなど、裁判官が知財訴訟で検討する可能性のある「保護可能な」要素が多数あると指摘した。 「これらの作品が適切にライセンスされていない限り、それらの作品をトレーニングすることは著作権侵害となる可能性があります。」と彼は述べた。
TechCrunchは、Epic、Microsoft(Minecraftを所有)、Ubisoft、任天堂、Roblox、サイバーパンク開発会社CD Projekt Redを含む多くのゲームスタジオやパブリッシャーにコメントを求めた。返答した人はほとんどいなかったし、記録上の声明を出した人もいなかった。
CDプロジェクト・レッドの広報担当者は「現時点では取材に応じることはできない」と述べた。 EAはTechCrunchに対し、「現時点ではコメントはない」と語った。
リスクのある出力
こうした法的紛争ではAI企業が勝つ可能性がある。約10年前に出版業界がGoogleを相手取って訴訟した前例に倣い、裁判所は生成AIには「非常に説得力のある変革的目的」があると判断する可能性がある。
この訴訟では、裁判所は、Google が一種のデジタル アーカイブである Google ブックス向けに数百万冊の書籍をコピーすることは許容されるとの判決を下しました。著者と出版社は、自分たちの知的財産をオンラインで複製することは侵害に当たると主張しようとしていた。
しかし、AI企業に有利な判決が出ても、必ずしもユーザーが不正行為の告発から守られるわけではない。生成モデルが著作権で保護された作品を逆流した場合、その作品を公開したり、別のプロジェクトに組み込んだりした人は依然として知的財産侵害の責任を問われる可能性があります。
「生成 AI システムは、多くの場合、認識可能で保護可能な IP 資産を出力として吐き出します」と Weigensberg 氏は述べています。 「テキストや静止画像を生成する単純なシステムでは、出力に著作権で保護された素材が生成されるのを防ぐのに苦労することがよくあります。そのため、プログラマの意図が何であれ、より複雑なシステムでも同じ問題が発生する可能性があります。」
一部の AI 企業は、こうした状況が発生した場合に備えて補償条項を設けています。しかし、条項にはカーブアウトが含まれることがよくあります。たとえば、OpenAI は法人顧客にのみ適用され、個人ユーザーには適用されません。
ワイゲンスバーグ氏は、商標権の侵害など、著作権以外にも考慮すべきリスクがあると述べています。
「その出力には、ゲームの認識可能なキャラクターなど、マーケティングやブランディングに関連して使用される資産も含まれる可能性があり、商標リスクが生じます」と同氏は述べた。 「そうでないと、その出力によって名前、画像、肖像権のリスクが生じる可能性があります。」
世界モデルへの関心の高まりにより、このすべてがさらに複雑になる可能性があります。 OpenAI が Sora とみなしているワールド モデルのアプリケーションの 1 つは、基本的にビデオ ゲームをリアルタイムで生成することです。これらの「合成」ゲームがモデルのトレーニングに使用されたコンテンツに似ている場合、法的に問題となる可能性があります。
「ビデオゲームの音声、動き、キャラクター、歌、ダイアログ、アートワークに関して AI プラットフォームをトレーニングすることは、これらの要素が他の文脈で使用された場合と同様に、著作権侵害となります。」と McKool の知財裁判弁護士、エイブリー・ウィリアムズは述べています。スミス氏は語った。 「生成AI企業に対する非常に多くの訴訟で生じたフェアユースをめぐる疑問は、他のクリエイティブ市場と同様にビデオゲーム業界にも影響を与えるだろう。」