GPT-5.6降价三分之二还内置了浏览器操控,OpenAI终于把Agent牌打出来了

AI风向标Agent 2026-06-26 12:41:56 5阅读 举报

6月23日,OpenAI正式发布了GPT-5.6系列,涵盖Mini、标准版和Pro三个版本。我是第一时间关注到这条消息的,但等了两天才决定写——因为这次升级的意义,可能比很多人想的要大。

不是参数升级,是产品形态的质变

GPT-5.6最值得关注的不是推理能力提升了多少(Juice Value 960,比上代+25%),而是它内置了Playwright浏览器自动化能力。

说人话就是:ChatGPT从此不再只是一个对话窗口,而是一个能替你操作浏览器的数字员工。它能打开网页、填写表单、点击按钮、抓取数据,跨页面完成多步操作流程。

X上已经有拿到测试资格的开发者实测:一条指令下去,GPT-5.6 Pro花了48分钟,从零写出了一个完整可玩的《模拟人生》纯HTML文件,情感AI、职业系统、角色行为逻辑全在里面。代码自己写、自己跑、自己出结果。

还有更狠的——给它一张UI截图,它能像素级还原出对应的HTML/CSS代码。前端做原型的速度直接被拉满了。

降价三分之二:趁Fable 5不在,直接占领心智

GPT-5.6的定价策略也极为激进:API价格约为Claude Fable 5的三分之一。输入约$3/百万token,输出约$12/百万token。

Fable 5虽然因为监管原因被叫停,但它留下的定价锚点还在用户心智里。OpenAI用「三分之一价格」这个比较框架,等于是趁Fable 5缺席的窗口期直接发动总攻。150万token上下文窗口虽然不如Fable 5的200万,但对绝大多数场景来说已经绰绰有余——整仓代码扔进去一次搞定。

再加上Playwright原生集成、3D对象生成(SVG直出可交互场景)、视觉复刻代码,这套组合拳打出来,OpenAI明显不是在挤牙膏,而是在用一个中间版本(5.5到6之间的过渡版)重新定义「Agent应该长什么样」。

一个意外插曲:白宫要求限量发布

这里有个值得注意的细节。据Axios报道,白宫国家网络总监办公室和科技政策办公室已要求OpenAI分阶段限量发布GPT-5.6——先在少数政府批准的合作伙伴范围内推出,逐一审批访问权限。这是美国政府首次要求AI公司限量发布新模型。

Altman在内部备忘录中表示同意了,但也说「这不是我们首选的长期模式」。他希望几周后能全面发布。

加上此前Anthropic的Fable 5被出口管制、Claude Mythos被叫停,美国政府对前沿AI模型的管控正在从「建议」加速走向「强制」。这对整个行业意味着什么,值得持续关注。

这个可能会改变游戏规则

我的判断是:GPT-5.6不是一个简单的模型升级,它宣告了AI Agent从概念到产品的关键一跃。

过去我们说的AI Agent,更多是开发者在框架层面自己搭——写代码调用API、管理状态、处理异常。GPT-5.6把浏览器操控直接变成模型的原生能力,这意味着你不需要额外的Agent框架,模型自己就是Agent。

配合OpenAI同期公布的AGI路线图——2026下半年推出ChatGPT Agent和Pulse,2027年形成完整个人AGI,2028年3月AI与科研人员平等协作——你会发现这一切是串联的:先让模型能「动手」,再让它能「长期记住你」,最后让它能「和你平等协作」。

降价三分之二不是慈善,是OpenAI在用价格换规模、用规模建生态。当Agent的成本降到ChatGPT普通对话的三分之一,开发者把业务流程交给AI就不再是「试试看」,而是「算得过账」。

这对国内AI应用开发者来说,也是一个大信号:别再做只会聊天的AI了,用户要的是能帮他们「做事」的AI。谁先让AI真的能动手,谁就能在下一轮竞争中占住位置。

版权声明:
作者:AI风向标
链接:https://www.aiddithome.com/p/41b3188cdacbe.html
来源:Agent
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以点击 “举报”


登录 后发表评论
6条评论
熵熵
1楼 · 14小时前

AI能自己操控浏览器了?那我以后是不是可以让它帮我抢茅台了??

工具猎人
2楼 · 14小时前

Playwright原生集成这个点确实是大升级。之前用Agent框架调浏览器,十个任务有八个卡在登录态和验证码上,原生集成意味着模型自己知道怎么处理这些异常了。这才是从"演示"到"能用"的关键一步。

算法老K
3楼 · 14小时前

48分钟盲编模拟人生这个case我在X上也看到了,代码跑了之后发现它自己处理了状态管理、事件循环和DOM渲染——这些是以前AI写代码最容易翻车的地方。5.6在长链推理上的稳定性确实比5.5强了不止一点。

AI搞钱研究所
4楼 · 14小时前

白宫限量发布那段挺有意思的。一边是OpenAI急着打价格战抢市场,一边是美国政府要逐个审批客户。这种拉锯以后会是常态吧?技术跑得比监管快太多了。

栗子同学
5楼 · 14小时前

作为小白我只想问一句:它能帮我自动填报销单吗?能的请举手?