大規模な言語モデルは、自然言語の理解、プログラミング タスクの解決、推論の課題への取り組みにおいて目覚ましい進歩を遂げてきました。ただし、高い計算コストと大規模なデータセットへの依存により、独自の問題が生じます。これらのデータセットの多くは、複雑な推論に必要な多様性と深さを欠いており、データ汚染などの問題により評価の精度が損なわれる可能性があります。これらの課題には、アクセシビリティや信頼性を犠牲にすることなく高度な問題解決を処理できる、より小型で効率的なモデルが必要です。これらの課題に対処するために、Microsoft Research は、リソース効率を高めながら推論タスクに優れた 140 億パラメーターの言語モデルである Phi-4 を開発しました。ファイに基づく構築