OpenAI正式发布GPT-5.4系列模型:集成原生计算机操作能力与实时思考预览功能
SmartHey3月6日消息,OpenAI 今日正式推出 GPT-5.4 系列模型,涵盖面向 ChatGPT 和 API 用户的 GPT-5.4 Thinking 版本,以及专为高难度专业任务优化的 GPT-5.4 Pro 版本。
这是 OpenAI 首次将先进推理、代码生成与智能体(Agent)能力深度融合于单一大型语言模型之中,旨在显著提升科研、工程与创意等专业场景下的工作效率与输出准确性。
在 ChatGPT 应用中,GPT-5.4 Thinking 引入全新‘思考过程预览’功能:面对复杂问题时,模型会主动分步呈现其逻辑推演路径;用户可在响应生成过程中即时干预、修正方向,大幅降低反复提问与试错成本,更快锁定理想结果。
该模型还显著强化了深度网络检索与长程上下文建模能力——尤其在应对高度定制化查询时,能更稳定地维持百万级 token 上下文中的语义一致性;对于需多步推演的问题,它对对话历史各阶段的感知更敏锐,保障最终回答全程紧扣主题、逻辑连贯。
在 Codex 开发平台及 API 接口层面,GPT-5.4 成为 OpenAI 首个具备原生计算机使用能力(computer-use capabilities)的通用大模型,可结合屏幕截图与键盘/鼠标指令,自主操作桌面应用,完成跨软件、多步骤的自动化工作流,例如数据抓取→表格整理→PPT生成→邮件发送。
GPT-5.4 全系列支持最高达 100 万 tokens 的上下文窗口,使 AI 智能体真正具备端到端规划、执行与自我验证长周期复杂任务的能力。
