Google のこの動きにより、Gemini AI の信頼性が ChatGPT よりも低くなる可能性があります。その理由は次のとおりです。

Google は最近、Google のサービスに取り組む請負業者向けの内部ガイドラインを変更しました。 ジェミニAI TechCrunch の報告によると、特にヘルスケアなどのデリケートなトピックに関して、AI モデルの信頼性について懸念が生じています。この変更により、ユーザーに提供される情報の間違いが増える可能性があり、Gemini の信頼性が OpenAI の ChatGPT よりも低くなります。

とおり テッククランチ、日立が所有する企業である GlobalLogic と協力する請負業者は、真実性などの要素について AI の応答を評価することで、Gemini の改善に貢献しています。最近では、不正確なフィードバックを避けるために、専門分野以外のプロンプトをスキップすることが許可されました。

たとえば、請負業者には科学的背景がないため、心臓病に関するニッチな質問をするプロンプトをスキップする可能性があります。

これは、請負業者が稀な病気などの専門知識のない問題について、高度に技術的な AI の応答を評価する任務を負うことがあるため、特定のトピックに関する Gemini の精度に対する直接的な懸念につながりました。

しかし先週、GlobalLogicはGoogleからの変更を発表し、請負業者は自身の専門知識に関係なく、そのようなプロンプトをスキップすることは許可されなくなったと報告書は述べている。

TechCrunchが確認した内部メッセージによると、ガイドラインには「このプロンプトを評価するための重要な専門知識(コーディング、数学など)がない場合は、このタスクをスキップしてください」と書かれていたことが明らかになった。

現在、ガイドラインには「専門的なドメイン知識を必要とするプロンプトをスキップしないでください」と記載されています。請負業者には現在、「プロンプトの理解した部分を評価」し、必要な知識が不足しているかどうかを言及するようアドバイスされている。

「スキップの目的は、より優れた人に任せて精度を高めることだと思っていましたか?」 TechCrunchが確認した内部通信には、ある請負業者が記載されていた。

新しいガイドラインでは、請負業者がプロンプトをスキップできるのは 2 つの場合に限られている。つまり、完全なプロンプトや応答など「情報が完全に欠落している」場合、または評価に特別な同意書が必要な有害なコンテンツが含まれている場合だ。

(TechCrunch からの情報を含む)



出典