米国、サンフランシスコ:
OpenAIの研究者から内部告発者に転身した26歳のスチル・バラジ氏が先月、米国サンフランシスコのアパートで死亡しているのが発見された。 11月26日の彼の死は、警察が不正行為の証拠を見つけられなかったため、サンフランシスコ検視局によって自殺と判断された。
8月にOpenAIを退社したバラジ氏は、ここ数カ月間、インターネットからかき集めた著作権で保護された素材を使ってチャットボットを訓練するという人工知能企業の慣行に公然と反対の声を上げた。人工知能 (AI) の巨人は、データ収集慣行に関連するいくつかの訴訟を戦っている。
スチル・バラジについて
インド系アメリカ人のスチル・バラジは、カリフォルニア州クパチーノで育ちました。非常に頭の切れる子供であった彼は、プログラミング コンテストで優秀な成績を収め、ACM ICPC 2018 世界決勝戦で 31 位となり、2017 年のパシフィック ノースウェスト地域プログラミング コンテストとバークレー プログラミング コンテストで優勝しました。
Balaji 氏は、Kaggle の TSA 主催の「乗客スクリーニング アルゴリズム チャレンジ」でも 7 位に入賞し、賞金 10 万ドルを獲得しました。 LinkedIn のプロフィールによれば、彼は 2016 年の全米オープン チャンピオンであり、USACO ファイナリストでもありました。
同分野の他のほとんどの人と同様に、バラジ氏も幼い頃から人工知能の可能性の虜になっていました。 10月にニューヨーク・タイムズ紙に受けたインタビューの中で、同氏は10代の頃にAIテクノロジーに関するニュース記事を偶然目にし、ニューラル・ネットワークが人類の最大の問題を解決できるのではないかと想像したことがきっかけでAIに興味を持ち始めたと述べた。
ニューヨークタイムズ紙の報道によると、同氏は「AIは病気の治療や老化の阻止など、解決不可能な問題を解決するために利用できるものだと考えていた…それらの解決に役立つ何らかの科学者を発明できると考えた」と述べたという。 。
卒業する前から、Scale AI、Helia で働き、Quora でソフトウェア エンジニアを務めていました。 2020 年、バラジは OpenAI で働き始めたバークレー卒業生の流れに加わりました。
スチル・バラジの OpenAI での時間
彼は OpenAI に 4 年間勤務し、そのうちの 1 年半は、同社がオンライン チャットボットである ChatGPT を構築するために使用した膨大な量のインターネット データの収集と整理を支援しました。
Balaji 氏は NYT に対し、OpenAI で最初にデータを作成した際、同社が著作権で保護されたインターネット データとオープン インターネット データの両方を使用して製品を構築する法的権利があるかどうかを慎重に検討しなかったと語った。彼がこの問題について熟考し始めたのは、2022 年後半に ChatGPT がリリースされてからであり、ChatGPT のようなテクノロジーが著作権で保護されたデータを使用することでインターネットに損害を与え、その過程で法律に違反していることに気づきました。
バラジ氏は、2024年までに「社会に利益よりも害悪をもたらすと信じていたテクノロジーにはもう貢献したくない」と悟ったと語った。彼は今年8月に新たな職を持たずに会社を辞め、「個人プロジェクト」と呼ぶものに取り組み始めた。
同氏は、AI大手を告訴した人々が起こした訴訟の一環としてOpenAIがファイルを検索する対象者として裁判所への提出書類に名前が挙げられた翌日に亡くなった。
OpenAIに対するスチル・バラジ氏の申し立て
OpenAI を去った後、スチル バラジ氏は、AI 企業が著作権で保護されたデータを使用してテクノロジーを開発する方法に公に反対しました。同氏は、AIモデルは許可なくインターネットから収集した著作権で保護された素材を使用してトレーニングされているため、他人の労働に過度に依存していると主張した。
「これはインターネットエコシステム全体にとって持続可能なモデルではない」と同氏は語った。 今。
彼はまた、自身の懸念についても説明した。 個人のウェブサイトそこで同氏は、生成モデルがトレーニング データと同一の出力を生成することはめったにないものの、トレーニング中に著作権で保護された素材を複製する行為は、「フェアユース」で保護されなければ法律に違反する可能性があると指摘しました。
「フェアユースはケースバイケースで判断されるため、生成型 AI がいつフェアユースに適格となるかについて広範な発言はできない」と同氏は述べた。
Balaji 氏は、いくつかのケースで、チャットボットが学習した著作物と直接競合すると主張しました。同氏は、「生成モデルはオンラインデータを模倣するように設計されているため、ニュース記事からオンラインフォーラムまで、インターネット上の『基本的にあらゆるもの』を置き換えることができる」と述べた。
同氏によると、最大の問題は、AI技術が既存のインターネットサービスを徐々に置き換えていく中で、AI技術が時として「虚偽の、時には完全にでっち上げられた情報、つまり研究者が「幻覚」と呼ぶ情報」を生み出すことだという。
同氏は、インターネットは悪い方向に変化していると語った。
AI企業に対する申し立て
AI 企業が著作権者のデータを悪用してチャットボットをトレーニングすることを懸念しているのはバラジ氏だけではありません。ニューヨーク・タイムズを含む米国とカナダのニュース出版社数社は、OpenAIとその主要パートナーであるマイクロソフトに対し、数百万件の記事を使用してチャットボットを構築したとして訴訟を起こし、そのチャットボットは現在、信頼できる情報源として報道機関と競合していると主張している。
ジョン・グリシャムを含む多くのベストセラー作家も同社に対して訴訟を起こしている。
OpenAI が申し立てを争う
OpenAIはバラジ氏の主張に異議を唱え、データ利用はフェアユースの原則と判例に従っていると主張した。
「私たちは、フェアユースと関連原則によって保護され、長年広く受け入れられてきた判例によって裏付けられた方法で、公開データを使用して AI モデルを構築しています。私たちは、この原則がクリエイターにとって公平であり、イノベーターにとって必要であり、米国の競争力にとって重要であると考えています」 」とOpenAIは声明で述べた。
会社は言いました BBC 11月には同社のソフトウェアが「クリエイターにとって公平でイノベーションをサポートするフェアユースおよび関連する国際著作権原則に基づいている」と述べた。
バラジさんの死を受け、オープンAIの広報担当者は「今日この信じられないほど悲しいニュースを知りショックを受けており、この困難な時期にスチルさんの愛する人たちに心を痛めている」と述べた。