今天凌晨2点10分OpenAI正式发布了GPT-5.4模型已经可以在ChatGPT、API和Codex中使用了。本次共有Thingking和Pro两种模型在性能方面超过了Claude最新的Opus 4.6和谷歌的Gemini 3.1pro。性能更强、成本更低咱们先聊聊5.4的核心技术亮点我最直观的感受就是GPT-5.4做专业相关的活越来越靠谱了。以前用AI做表格、写报告总担心出错还得自己反复核对现在它输出的内容一致性和准确性都提升了不少甚至能媲美行业里的专业人士。有个测试特别能说明问题针对美国九个主流行业的44个职业测试AI做标准化工作的能力GPT-5.4的表现有83%的场景能赶上甚至超过专业人士而上一代只有70.9%。像销售PPT、会计报表、急诊排班表这些实际工作要做的事都能轻松搞定连制造业图纸、短视频脚本都不在话下。尤其是做表格和PPT进步真的肉眼可见。以前AI做的表格公式容易错排版也乱PPT更是千篇一律没什么设计感。现在GPT-5.4做投行分析师的表格建模平均分能到87.3%比上一代高了快20个百分点做的PPT视觉设计更精致版式也更多样有68%的人都觉得比上一代做得好。错误率也降了不少。以前用AI查资料总怕它瞎编也就是大家常说的“幻觉”。现在GPT-5.4单条表述的错误率比上一代降了33%完整回答出错的概率也降了18%。用来做法律分析、财务模型这种需要精准度的活也更放心了。计算机操作比人类还猛这绝对是GPT-5.4最惊艳我的地方以前的AI只能帮你写文字、出思路不能直接操作电脑。现在它终于能自己动手了相当于给你配了一个全天候在线的电脑操作AI助理。能适配各种电脑操作场景既能通过代码控制电脑也能看着截图用鼠标和键盘指令操作。比如你让它发邮件、安排日历、批量录入数据它都能自己完成不用你手动一步步来。而且它的视觉理解能力也升级了能看懂高分辨率的图片和截图以前有些模糊的截图AI识别不准现在哪怕是细节很多的界面它也能精准定位点击操作也更准确。OpenAI还新增了一个“原始”图像精度档位能支持更高像素的图片对于做设计、看图纸的人来说真的太实用了。有个第三方测试针对三万多个业主协会和房产税门户网站GPT-5.4第一次尝试操作的成功率就有95%三次以内基本能100%成功。比以前的操作智能体强太多了速度还快了3倍token消耗也少了70%规模化用起来特别划算。代码能力大升级对于程序员来说GPT-5.4绝对是福音。它继承了GPT-5.3-Codex在写代码上的优势还结合了新的办公和操作能力做长周期的开发任务特别顺手。比如需要反复调试、用各种工具辅助的项目它能省不少事。最实用的是在Codex里开启快速模式后它的token生成速度能提升1.5倍写代码、调试的速度快了很多程序员不用再等半天能保持连贯的工作节奏。而且它做复杂前端开发也很厉害生成的页面不仅好看功能还特别全比上一代模型做出来的效果好太多。例如只用一个简单的指令GPT-5.4就借助工具开发出了一个交互式的主题公园模拟游戏能布置路径、搭建游乐设施。还能监控游客状态、资金情况甚至能自动完成浏览器测试不得不说这能力真的超出预期了。AI终于更像人了不知道大家有没有过这种体验用AI做复杂任务一开始说清楚了需求结果做着做着就偏了还得重新发指令特别麻烦。GPT-5.4就解决了这个问题它在处理复杂任务的时候会先跟你说清楚它的做事思路你觉得不对中途就能调整不用重新发起请求。而且它的记忆力也更好了处理高难度任务的时候能记住对话前期的步骤不会做着做着就忘了之前的要求哪怕是很长的工作流、很复杂的指令它也能连贯完成不用我们反复提醒。目前这个功能已经在网页版和安卓端上线了iOS端也快了用起来会更方便。此外以前用AI调用工具得提前把所有工具的用法都告诉它工具多了不仅麻烦还特别耗token响应也慢。现在GPT-5.4新增了工具检索功能就像我们用搜索引擎找东西一样它需要哪个工具自己就能实时查询用法不用我们提前铺垫。这样一来不仅省了很多token响应速度也快了面对一大堆工具的时候AI也能轻松应对。测试数据显示用工具检索模式总token消耗能减少47%准确率还不变对于需要用很多工具的企业来说能省不少成本。而且它调用工具的逻辑也更聪明了能自己判断什么时候需要用工具、怎么用工具不用我们反复提醒。比如让它读取邮件、提取附件、给文件评分再录入表格它能一步到位比上一代少走很多弯路。上网找信息的能力也升级了以前有些“大海捞针”式的精准查询AI找半天找不到。现在GPT-5.4能通过多轮检索找到最相关的信息还能整合起来给出清晰的回答比我们自己上网找效率高多了。最后跟大家说下大家最关心的上线渠道和价格。GPT-5.4现在已经在ChatGPT和Codex平台逐步上线了API端也推出了标准版和专业版专业版主要针对有复杂任务需求的开发者。在ChatGPT里Plus、团队版、专业版用户现在就能用GPT-5.4思维版替代了之前的GPT-5.2思维版。以前的GPT-5.2会在历史模型板块保留3个月6月5号就正式下线了。价格方面API端的GPT-5.4单token定价比GPT-5.2高一点每一百万输入token 2.5美元输出是每一百万15美元。但它更省token总体算下来多数任务的成本反而更低。