OpenAI、最新AIモデル「GPT-4.1」を発表
- 桜井 未来
- 4月15日
- 読了時間: 2分

mini/nanoもラインナップに追加、GPT-4oを超えるスコアで大幅進化
OpenAIは米国時間4月14日、最新の大規模言語モデル「GPT-4.1」シリーズを発表した。このシリーズには、標準モデル「GPT-4.1」のほか、軽量版の「GPT-4.1 mini」と「GPT-4.1 nano」が含まれ、いずれもAPI経由で利用可能となっている。
GPT-4.1シリーズでは、コンテキストウィンドウが最大100万トークン(GPT-4oは12万8000トークン)の入力に対応したほか、コーディング能力や命令への追従性能もGPT-4oシリーズより大幅に向上。低レイテンシーかつ高いコストパフォーマンスを実現している。
主な特徴と性能向上のポイントは以下の通り。
大規模なコンテキストウィンドウ
GPT-4.1は最大100万トークンのコンテキストを処理可能で、前モデルのGPT-4oの12万8000トークンから大幅に拡張された。
コード生成能力の向上
ソフトウェア開発ベンチマーク「SWE-bench Verified」で54.6%のスコアを記録し、GPT-4oより21.4%、GPT-4.5より26.6%の改善を示した。
指示理解の精度向上
指示に対する追従能力を測定する「Scale’s MultiChallenge」のベンチマークで38.3%のスコアを達成し、GPT-4oより10.5ポイント向上した。
長文理解の強化
マルチモーダル長文理解ベンチマーク「Video-MME」の「長文・字幕なし」カテゴリで72.0%のスコアを記録し、GPT-4oより6.7%の改善を示した。
また、軽量版の「GPT-4.1 mini」は、小型モデルながらGPT-4oを多くのベンチマークで上回る性能を持ち、レイテンシーを約50%削減、コストを83%削減している。そして 「GPT-4.1 nano」は、 最小・最速・最安のモデルでありながら、MMLUで80.1%、GPQAで50.3%、Aider polyglot codingで9.8%のスコアを達成し、GPT-4o miniを上回る性能を示している。 これらのモデルは、低レイテンシーが求められる分類や自動補完などのタスクに最適なモデルである。
GPT-4.1について、以下の動画でも詳細を確認できる。
なお、OpenAIは、開発者に十分な移行期間を確保するため、GPT-4.5プレビューを3ヶ月先の7月14日までに廃止する予定だ。
参照サイト
OpenAI公式サイト