AI の精度が危険にさらされていますか?請負業者は専門外のジェミニの反応を評価することを強いられる

ハイライト

Gemini AI に影響を与える Google の新しいポリシーにより、重要なトピックに関するその出力の信頼性が低下する可能性があるという懸念が生じています。

最近まで、請負業者には、専門的すぎるプロンプトや知識領域外のプロンプトをスキップするオプションがありました。

ただし、Google の新しい内部ガイドラインにより、この柔軟性は削除されました。

生成 AI は、数学の問題から医療上の質問まで、あらゆるものに数秒で答える、魔法のように思えるかもしれません。しかし、これらのシステムの背後では、Google などの企業が「迅速なエンジニア」とアナリストのチームを雇用しており、チャットボットの応答の精度を評価してテクノロジーを微調整しています。現在、Google の Gemini AI に影響を与える新しいポリシーにより、重要なトピックに関するその出力の信頼性が低下する可能性があるという懸念が生じています。

Google の AI チャットボットである Gemini は、「真実性」などの要素に関する応答を評価するために、日立が所有するアウトソーシング会社である GlobalLogic の請負業者に依存しています。最近まで、これらの請負業者には、専門的すぎるプロンプトや知識領域外のプロンプトをスキップするオプションがありました。たとえば、まれな心臓病に関する回答を評価するよう求められた場合、医学的知識のない請負業者は単純にその回答を評価しないという選択をする可能性があります。ただし、Google の新しい内部ガイドラインにより、この柔軟性は削除されました。

こちらもお読みください: Google、最も強力な AI モデルである Gemini 2.0 を発表: Gemini 1.5 との違い

TechCrunch によると、更新された規則では、請負業者は、たとえ自社が持っていない専門知識を必要とするものであっても、すべてのプロンプトを評価することが求められています。請負業者は「プロンプトの理解した部分を評価」し、ドメイン知識が不足している場合はメモを残す必要があります。スキップは 2 つの場合にのみ許可されます。プロンプトまたは応答が不完全な場合、または評価に特別な承認が必要な有害なコンテンツが含まれている場合です。

以前のガイドラインには、「このプロンプトを評価するための重要な専門知識 (コーディング、数学など) がない場合は、このタスクをスキップしてください。」と明示的に記載されていました。しかし、更新版には「専門的なドメイン知識を必要とするプロンプトをスキップしないでください」と書かれています。

この変更により、特に医療や技術的なテーマなどのデリケートなトピックに関して、ジェミニの精度に対する懸念が生じています。ある請負業者は社内チャットで「スキップする意味は、より優れた人に任せて精度を上げることだと思っていたのに?」と不満を漏らした。

潜在的な影響は重大です。請負業者は専門知識を超えたトピックをレビューすることを余儀なくされており、誤ってエラーのある回答を承認してしまう可能性があります。これにより、Gemini の出力が不正確になり、信頼できる情報を AI に依存している人々に影響を与える可能性があります。

アユシ・ジェインアユシ・ジェイン

アユシ・ジェイン

昼はテクノロジーニュースライター、夜はBGMIプレイヤー。テクノロジーとゲームに対する私の情熱を組み合わせて、両方の世界の最新情報をお届けします。フルプロフィールを表示



出典