OpenAI發布GPT-5.4:編程推理一體化,可操控電腦

OpenAI正式推出GPT-5.4,分為Thinking和Pro兩個版本。融合編程、推理和Agentic工作流,專業知識基準從68.4%飆升至87.3%。

OpenAI發布GPT-5.4:編程推理一體化,可操控電腦

概述

OpenAI於3月5日正式發布GPT-5.4,被譽為「最強大的專業級AI模型」。GPT-5.4提供Thinking與Pro兩個版本,整合了GPT-5.3 Codex的編程能力、強化推理及Agentic工作流程,在專業知識基準測試中拿下87.3%的亮眼成績,較前代GPT-5.2的68.4%大幅躍升近19個百分點。這次發布被視為OpenAI在AI Agent競賽中的一次重大押注。

核心功能突破

GPT-5.4帶來三大重要進化。其一是**思維過程可介入**——Thinking模型讓使用者能在AI推理過程中即時調整方向,並預先展示行動方案,賦予使用者對AI決策過程前所未有的掌控力。其二是**深度網路研究**能力獲得顯著提升,模型能更有效率地從網路擷取與彙整資訊,支撐更複雜的研究型任務。其三也是最具革命性的突破——**電腦操控功能**。模型能撰寫自動化程式碼,依據螢幕截圖發出滑鼠與鍵盤指令,達成真正的端到端任務自動化。AI不再只是提供建議的顧問,而是能直接動手操作的執行者。

效能與方案

Thinking版開放給Plus、Team及Pro使用者,Pro版僅限Pro與Enterprise方案。API端已同步上線gpt-5.4與gpt-5.4-pro兩個端點,開發者可立即串接。雖然單一token成本較GPT-5.2為高,但由於模型效率大幅提升,完成同等任務所需的token數量減少,實際使用的總成本與性價比反而更優。

產業影響與展望

GPT-5.4標誌著AI從「對話助理」邁向「自主代理」的關鍵轉捩點。電腦操控能力意味著AI將直接參與工作流程的執行,深刻改變軟體開發、資料分析、辦公自動化等知識工作的運作模式。競爭對手Anthropic與Google勢必將加速追趕。未來的AI競賽將更加激烈。