Google Gemini が予想外に OpenAI を抑えて 1 位に急上昇、しかしベンチマークはすべてを語らない


Google の Gemini-Exp-1114 AI モデルは主要なベンチマークのトップにありますが、専門家は、従来のテスト方法では真の AI 機能や安全性を正確に測定できなくなっている可能性があり、業界の現在の評価基準に対する懸念が高まっていると警告しています。続きを読む