訴訟は決して愛の祭典ではないが、ニューヨーク・タイムズとOpenAIおよびMicrosoftの両社との間の著作権争いは特に議論が分かれている。今週、タイムズ紙は、OpenAIのエンジニアが、同紙のチームが150時間以上かけて潜在的な証拠として抽出したデータを誤って消去したと主張した。
OpenAIはデータの大部分を回復することができたが、タイムズの法務チームは元のファイル名とフォルダー構造がまだ欠けていると述べている。によると 宣言 同紙の弁護士ジェニファー・B・メイゼル氏が水曜日に法廷に提出したこの情報は、「ニュース原告がコピーした記事のどこに」その情報がOpenAIの人工知能モデルに組み込まれた可能性があるかを判断するために使用することはできないことを意味する。
OpenAIの広報担当者ジェイソン・デュートロム氏は声明で「我々は行われた特徴づけに同意せず、すぐに回答を提出する予定だ」と声明でWIREDに語った。ニューヨーク・タイムズはコメントを拒否した。
同紙は昨年、OpenAIとMicrosoftに対し、両社がChatGPTなどの人工知能ツールの訓練に記事を違法に使用したとして著作権訴訟を起こした。この訴訟は、AI企業と出版社の間で進行中の多くの法廷闘争の1つであり、デイリーニュースが起こした同様の訴訟も同じ弁護士の一部が担当している。
タイムズ紙の事件は現在証拠開示中であり、これは双方が証拠となる可能性のある文書や情報を提出していることを意味する。プロセスの一環として、OpenAI は法廷からトレーニング データをタイムズ紙に提示するよう求められましたが、これは大きな問題です。OpenAI は、AI モデルの構築にどのような情報が使用されたかを正確に公表したことはありません。これを開示するために、OpenAIは、裁判所がタイムズの弁護士が選別できる2台の「仮想マシン」からなる「サンドボックス」と呼ぶものを作成した。メイゼル氏は宣言の中で、OpenAIのエンジニアがこれらのマシンの1つでタイムズ紙のチームによって整理されたデータを「消去」したと述べた。
マイゼル氏の提出書類によると、OpenAIは情報が削除されたことを認め、今月初めにこの問題について警告を受けた直後に問題に対処しようとした。しかし、同紙の弁護士が「復元された」データを調べたところ、あまりにも整理整頓されておらず、「膨大な工数とコンピュータ処理時間を費やして仕事を一から作り直す」ことを余儀なくされたと、タイムズの他の数人の弁護士が記事で述べた。 手紙 メイゼルの陳述と同じ日に裁判官に提出した。
弁護士らは、削除が「意図的」であったと「信じる理由はない」と述べた。メイゼル氏の手紙とともに証拠として提出された電子メールの中で、OpenAIの顧問トム・ゴーマン氏はこう述べている。 参照した データ消去は「グリッチ」として扱われます。