OpenAIは2025年12月11日、最新のAIモデル「GPT-5.2」を発表しました。このモデルは、専門的な知識業務と長時間エージェントタスクに特化しており、特に注目すべきは、44職種の知識業務タスクを評価するGDPvalベンチマークにおいて、人間の専門家レベルに到達した点です。本記事では、GPT-5.2がもたらす驚異的な性能向上と、それがビジネスにもたらすインパクトについて解説します。
専門業務で人間を超える性能
GPT-5.2の最も大きな成果は、専門業務タスクにおける性能です。GPT-5.2 Thinkingは、営業用プレゼンテーション、会計スプレッドシート、製造図面など、米国GDPに大きく寄与する上位9産業の44職種を対象としたGDPvalベンチマークで、業界専門家と同等以上の成果を示す70.9%の勝率を記録しました[2]。これは、OpenAIのモデルとして初めて人間の専門家レベルに到達したことを意味します。
驚異的な効率性と技術的進化
GPT-5.2は、単に性能が高いだけでなく、その効率性も特筆に値します。専門家の11倍以上の速度で、かつ1%未満のコストでタスクを生成できるとされています[2]。これにより、人間による最終確認を組み合わせたハイブリッドワークフローの実用性が飛躍的に高まります。
コーディングと長文コンテキスト処理の進化
技術面では、コーディング性能が大幅に向上し、SWE-Bench Proで55.6%という最高スコアを達成しました。また、長文コンテキスト処理能力も強化され、256kトークンまで対応し、ほぼ100%の精度を達成しています。これにより、数十万トークン規模のレポートや契約書なども、一貫性と精度を保ちながら処理することが可能になりました[2]。
安全性とVision性能の向上
安全性と信頼性も強化されており、ハルシネーションの発生がGPT-5.1 Thinkingと比較して相対的に38%減少しました。さらに、Vision性能も向上し、チャート推論やソフトウェアインターフェース理解におけるエラー率を約半分に削減するなど、マルチモーダルなタスク処理能力も進化しています[2]。






