
「Codex 5.3は何が変わったのか」「5.1 Maxのままで良いのか」「5.2から乗り換える意味はあるのか」。
モデル更新が続く中、体感や噂で選ぶと判断を誤りがちです。本記事では、OpenAI公式ブログ、公式開発者ドキュメント、公式リリースノート、システムカード(PDF)といった一次情報のみを参照し、Codex 5.3(GPT-5.3-Codex)の変更点と既存モデルとの差分を冷静に整理します。
速度、公開評価結果、提供状況、実務での使い分けまで、現時点で確認できる事実に基づいて解説します。
Codex 5.3(GPT-5.3-Codex)の位置づけ
Codex 5.3(正式名:GPT-5.3-Codex)は、OpenAIが2026-02-05に発表した最新のCodex系モデルです。
公式発表では「CodexとGPT-5のトレーニングスタックを統合した初のモデル」「エージェント型コーディング用途を前提に最適化」と説明されています。
公式に明示されている主な特徴
- Codex利用時に約25%の高速化
- 長時間タスク中の進捗共有・途中指示への追従性の改善
- 複数の公開ベンチマークにおける性能上積み
- Codexアプリ/CLI/IDE統合向けに先行提供
※以上はいずれもOpenAI公式ブログおよび開発者向け更新情報に明記されています(公式ブログ、公式リリースノート、開発者ドキュメント)。
比較の前提:何を基準に見るべきか
Codex系モデルの比較では、以下の観点が実務上の差に直結します。
- 長時間タスクでの破綻しにくさ
- ターミナル操作・環境操作を含む作業完遂力
- 途中での指示変更に対する追従性
- 応答速度と試行回数の確保しやすさ
Codex 5.3は、公式説明の中心がこの4点に置かれており、比較も同じ軸で行うのが合理的です。
Codex 5.3 と GPT-5.2-Codex の違い(公式評価)
OpenAI公式ブログの付録(Appendix)では、同一条件(xhigh reasoning effort)での比較結果が公開されています。
公開評価結果(抜粋)
- SWE-Bench Pro(Public)
- GPT-5.3-Codex:56.8%
- GPT-5.2-Codex:56.4%
- Terminal-Bench 2.0
- GPT-5.3-Codex:77.3%
- GPT-5.2-Codex:64.0%
- OSWorld-Verified
- GPT-5.3-Codex:64.7%
- GPT-5.2-Codex:38.2%
- Cybersecurity CTF Challenges
- GPT-5.3-Codex:77.6%
- GPT-5.2-Codex:67.4%
(出典:OpenAI公式ブログ/2026-02-05 公開)
評価結果の読み取り
SWE系の純粋なコード修正性能は小幅な差に留まっていますが、
ターミナル操作・OS操作を含む評価で大きく伸びている点が特徴です。
これは、単なるコード生成ではなく「実行・検証・修正を含めて完了させる作業」で差が出やすいことを示唆します。
GPT-5.1-Codex-Max との違い
GPT-5.1-Codex-Maxは2025-11-19に発表されたモデルで、「長時間タスク耐性」を前面に出した設計が特徴です。
GPT-5.1-Codex-Max の公式な位置づけ
- コンテキスト圧縮(コンパクション)による長時間作業の安定性
- Responses API を前提とした運用
- 発表時点での評価では、SWE-Bench Verified や Terminal-Bench で改善が提示
Codex 5.3 との設計思想の違い
- 5.1 Max:長時間保持・粘り強さを重視
- 5.3:速度、途中介入のしやすさ、OS/Terminal操作を含む実行力を重視
どちらが「上位」という単純な関係ではなく、
作業の性質(粘る作業か、操縦しながら進める作業か)で向き不向きが分かれると公式情報から読み取れます。
速度向上(約25%)の実務的な意味
公式に明記されている「約25%高速化」は、単なる応答時間短縮以上の影響があります。
- 同じ時間内で試行回数を増やしやすい
- 修正→再実行の往復が軽くなる
- 長時間タスク時の心理的負担が下がる
ただし、体感速度は利用環境やタスク内容に依存します。
これは公式にも「Codexユーザー向け」という注記があり、万能ではない点に注意が必要です。
提供状況とAPI対応
現在利用できる環境
- Codexアプリ
- Codex CLI
- IDE統合(公式対応拡張)
- WebベースのCodex Cloud
API提供について
- 現時点で公式に確定したAPI提供開始日は存在しません
- OpenAI公式ブログおよび開発者向け更新情報では「API access soon」とのみ記載
- 当面のAPI運用は
gpt-5.2-codexの継続利用が公式に案内されています
実務での選択指針(現時点)
- 日常的な実装・改修、CLI操作込みの作業
→ Codex 5.3 を試す価値が高い - API前提の自動化・パイプライン
→ 現状は GPT-5.2-Codex が現実的 - 超長時間の粘り強い作業
→ Codex 5.3 と GPT-5.1-Codex-Max を代表タスクで比較検証
いずれも公式情報から導ける範囲での整理であり、断定は避けるべきです。
まとめ
- Codex 5.3(GPT-5.3-Codex)は 2026-02-05 発表の最新Codex系モデル
- 公式に「約25%高速化」「途中指示への追従性改善」「実行系ベンチマークでの大幅改善」が明示されている
- 特にターミナル・OS操作を含む作業での性能向上が顕著
- API提供は現時点で未確定。確証ある公式日程は存在しない
- モデル選択は作業特性に応じて行うのが最も再現性が高い
新モデルは魅力的ですが、公式に確認できる事実を踏まえ、自身の代表タスクで検証した上で導入判断を行うことが最も安全で確実です。