来源:X @Pirat_Nation / Polymarket / Codex 内部日志泄露

4月23日才发的GPT-5.5,屁股还没坐热,GPT-5.6已经在Codex后台被扒出来了。
有人在OpenAI Codex的内部日志里发现了一条路由记录,大部分请求走的是GPT-5.5,但有一条偷偷指向了一个代号——gpt-5.6。开发环境已经在灰度测试了。
实锤有哪些?
目前关于GPT-5.6的信息,主要来自三个渠道:
- Codex日志泄露 — 一条路由映射记录出现了”gpt-5.6″的入口,虽然很快被撤下,但截图已经被疯传
- 内部代号曝光 — 开发日志里挖出了两个代号:“ember-alpha” 和 “beacon-alpha”,推测是5.6的不同测试分支
- 超大上下文实验 — 有人发现ChatGPT Pro的某些请求用了高达150万token的上下文窗口,比GPT-5.5的100万又多了50%
预测市场Polymarket上,GPT-5.6在7月31日前发布的概率已经飙升到了近80%。昨天一天涨了14个百分点,是这张合约上线以来最大的单日波动。
传闻中的升级点
目前社区传得最火的几个方向:
- 编程能力大跨步 — 前端终于不再是短板了,之前GPT-5.5在复杂前端交互上还是不如Claude,5.6据说要补上这块
- Agent能力质变 — 多步骤任务规划、自我纠错、工具编排,目标是”不用你盯着它干活”
- 计算机操作基本解决 — Computer Use从”勉强能用”往”取代人操作”的方向走了一大截
- 推理成本下降 — 更高效的架构设计,同样的任务花更少的token
- UltraFast模式 — 据传要把延迟再降2-5倍,对标开发者的实时体验
为什么这么快?
GPT-5.5是4月23日发布,GPT-5.5 Instant5月5日上线,5月中旬5.6就被发现了。
这种更新节奏不是正常迭代能解释的。缘由可能有三个:
|
缘由 |
说明 |
|
哥布林事件驱动 |
5.5之前出过一个”哥布林事故”——模型莫名其妙对哥布林、地精、浣熊产生统计性偏好,5.6是修复后第一个版本 |
|
军备竞赛 |
Anthropic的Claude Code压得太狠,OpenAI直接给从Claude Code迁移的企业送两个月免费Codex,2小时引来2000个开发者询价 |
|
数据飞轮 |
Codex每天海量的编程数据反哺训练,迭代速度远超封闭研发 |
值得期待吗?
GPT-5.5本身已经很强了——GDPval评测拿了84.9%,超越人类水平;在Agent编程场景上比5.4有明显的代际感。
如果5.6真能把Computer Use做到”基本解决”、前端编程彻底打通,那对开发者来说,可能真的要重新思考”写代码”这件事的定义了。
但也要泼盆冷水——泄露不等于发布,灰度测试到正式上线之间还有很长的路。
鹏叔的小黑板:
模型月更的时代来了。 以前等一个大版本要半年,目前三个月一更都嫌慢。对普通用户是好事——越来越强、越来越便宜;对开发者是焦虑——刚适配完新模型,下个版本又来了。


