GPT-5.4が登場。何が変わったのか？

OpenAIが2026年3月5日に GPT-5.4 を発表しました。ChatGPTでは GPT-5.4 Thinking として提供され、APIやCodexでも利用できます。[1]

新モデルが出るたびに「前より賢くなった」と言われますが、今回のGPT-5.4は、単に会話が自然になったというより、実際の作業をこなす力が強くなった ことが大きなポイントです。

この記事では、GPT-5.4で何が変わったのかを、専門用語をできるだけ避けながら整理します。

まず押さえたい前提

今回のGPT-5.4で名前として出てくるのは、主に次の3つです。[1]

GPT-5.4 Thinking
時間をかけて考えるタイプです。ChatGPTで長めの調査や整理をさせるときの中心になります。
Auto
ChatGPT側が、すばやく返すべきか、しっかり考えるべきかを判断して、GPT-5.3 Instant と GPT-5.4 Thinking を切り替える仕組みです。
GPT-5.4 Pro
さらに重い仕事向けの上位版です。長く複雑な作業向けの位置づけです。

ここで重要なのは、GPT-5.4は「新しい頭脳」ではあるが、特に強化されたのは雑談よりも実務寄りの処理だ という点です。[2]

GPT-5.4で変わったこと 1

文書・表計算・プレゼンのような「仕事の成果物」がかなり強くなった

OpenAIは今回の発表で、GPT-5.4を “professional work（実務向け）” のモデルとして位置づけています。[2]

特に強化されたと明言されているのが、次の3つです。[2]

スプレッドシート
文書作成
プレゼン資料

たとえばOpenAIの公開情報では、社内の表計算タスク評価で GPT-5.4 は 87.3%、GPT-5.2 は 68.4% でした。また、プレゼン評価では、人間の評価者が 68.0% の割合で GPT-5.4 の出力を GPT-5.2 より好んだとされています。[2]

この変化を普通の利用者向けに言い換えると、こうなります。

長いメモを整理して文書にする
比較表を作る
説明資料のたたき台を作る
見出しや構成を整える

こうした 「答えを出す」だけでなく、「読みやすい形に整える」作業 が、前の世代より得意になった、ということです。

GPT-5.4で変わったこと 2

長い依頼でも、途中で話がずれにくくなった

ChatGPTのリリースノートでは、GPT-5.4 Thinking について、長く考える必要がある質問で文脈をよりよく維持する と説明されています。[3]

API側でも、GPT-5.4は 1,050,000トークンのコンテキストウィンドウ を持つと案内されています。[4]
専門用語なので平たく言うと、かなり長い文章や長いやり取りを扱いやすくなった ということです。

普段の使い方でいうと、これは次のような場面で効いてきます。

長い記事や資料を読ませて要点をまとめる
条件が多い依頼を一度に投げる
何往復かしたあとでも、最初の条件を踏まえて続きをさせる

以前のモデルでもできないわけではありませんでしたが、GPT-5.4では 長い依頼を最後まで崩さず処理する力 が一段上がったと見るのが自然です。[2][3][4]

GPT-5.4で変わったこと 3

Web調査が強くなった

今回のGPT-5.4は、単に知識を答えるだけでなく、Web上の情報を探して整理する力 も強化されています。[2][3]

OpenAIは、GPT-5.4 Thinking が ChatGPTでの deep web research を改善したと説明しています。[3]
また公式発表では、難しい情報探索を測る BrowseComp という評価で、GPT-5.4 は 82.7%、GPT-5.2 は 65.8% とされています。[2]

ここで言いたいのは、「検索が速い」という話ではありません。

重要なのは、GPT-5.4が以前よりも、

情報を探し続ける
見つけた情報を整理する
長い調査の流れを維持する

という流れに強くなったことです。[2][3]

そのため、ニュースの整理、複数サービスの比較、少し調べにくいテーマの下調べなどで、体感差が出やすいモデルだと言えます。

GPT-5.4で変わったこと 4

事実関係のミスは減っている

OpenAIは、GPT-5.4について “our most factual model yet” と表現しています。[2]

公式発表では、ユーザーが「事実誤認があった」と指摘した種類の匿名化プロンプト群で比較した結果として、

個々の主張が誤っている確率が 33%低下
回答全体に何らかの誤りを含む確率が 18%低下

と説明しています。比較対象は GPT-5.2 です。[2]

これはかなり重要な変化です。

AIは便利でも、「もっともらしいが違うこと」を言う場面が弱点でした。GPT-5.4はその弱点を減らす方向に進んでいます。

ただし、ここは誤解してはいけません。
ミスが減ったこと と ミスがなくなったこと は別です。

つまりGPT-5.4は、前より信用しやすくなった一方で、契約・医療・法律・お金の判断のような重要な場面では、引き続き人間の確認が必要です。

GPT-5.4で変わったこと 5

開発者向けには「コンピュータ操作」が大きな進化

これは一般利用者には少し間接的な変化ですが、GPT-5.4の大きな特徴のひとつです。

OpenAIは、GPT-5.4を 初めての汎用コンピュータ操作対応モデル だと説明しています。[2]
公式発表では、APIとCodexにおいて、スクリーンショットを見ながら操作したり、ソフトウェアをまたぐ作業を進めたりする能力が強化されたとされています。[2]

また、ツールやコネクタを大量に使う環境でも、必要な道具を見つけて使う “tool search” が改善したと説明されています。[2]

一般の利用者にとっては少し遠い話に見えますが、今後AIが

アプリをまたいで作業する
ファイルを読み、表を作り、資料を整える
途中経過を確認しながら仕事を進める

といった使われ方をしていく土台になる変化です。

ChatGPTで見える変化

ChatGPT側でも、GPT-5.4に合わせて見え方が少し変わっています。[1][3]

1. Autoがより意味のある設定になった

Autoを選ぶと、ChatGPTは GPT-5.3 Instant と GPT-5.4 Thinking を切り替えます。[1]

そのため、普段の軽い質問では速いモデル、重い依頼では深く考えるモデル、という使い分けが以前より明確になっています。

2. 考え始める前に「何をするか」を先に出すことがある

OpenAIの案内では、GPT-5.4 Thinking や Pro は、考え始める前に 短い前置き で「これから何をするか」を示す場合があります。[1]
ChatGPTのリリースノートでも、最初に計画を示し、その途中で追加指示を入れられる ことが説明されています。[3]

これは、AIの内部事情を見せるためというより、途中で方向修正しやすくするためのUI上の改善 と考えるとわかりやすいです。

では、普通の利用者にとって何が一番大きいのか

GPT-5.4の変化を一言でまとめるなら、次のようになります。

「質問に答えるAI」から、「まとまった作業を仕上げるAI」に近づいた

たとえば以前より差が出やすいのは、こういう仕事です。

長い資料を読ませて、要点を整理する
比較表や提案文の形にまとめる
複数情報を見比べて、違いを説明する
調べながら答えを組み立てる
長いやり取りの条件を保ったまま仕上げる

逆に言えば、短い雑談や単発の質問だけだと、GPT-5.4の進化は見えにくいかもしれません。
今回の改善は、「少し重い仕事」をさせたときほど体感しやすい タイプです。[2][3]

まとめ

GPT-5.4は、単に「前より賢い新モデル」というだけではありません。

今回の中心は、実務に近い作業を、より正確に、より長く、より整った形で進められるようになったこと です。[2][3][4]

ポイントをまとめると、次のとおりです。

文書・表計算・プレゼン作成が強くなった
長い依頼や長文でも流れを保ちやすくなった
Web調査が強くなった
事実関係のミスが減った
開発者向けにはコンピュータ操作が大きく進化した

AIを「会話相手」として見ると、変化は少しわかりにくいかもしれません。
しかし、AIを「調べて、整理して、形にする道具」として見ると、GPT-5.4はかなり大きな更新です。

今後のChatGPTは、単発で質問に答えるだけでなく、文書・調査・資料整理のような仕事を一緒に進める方向 に、さらに寄っていくことになりそうです。

参考情報

※本記事は2026年3月6日時点の公開情報をもとにしています。