说实话,今天凌晨看到GPT-6发布的消息,我第一反应是——又来?
每次科技巨头发新品,铺天盖地都是”革命性突破”、”重新定义未来”,结果用起来就那样。但这次不一样,我仔细翻了翻参数,感觉OpenAI是真的急了。

先说最重大的——200万Token上下文。
这是什么概念?150万汉字左右。相当于能一次塞进去整部《资治通鉴》,或者十本长篇小说的内容量。
之前Claude靠超长上下文抢了多少市场,OpenAI心里门清。这次直接怼到200万,意思很明确:你有的我也要有,而且要更强。
对咱们实际用的人来说,这个升级挺实在的。列如你要分析一家公司过去20年的年报、财报、新闻报道,以前得分好几次喂给AI,目前一口气全倒进去,它照样能给你串起来理解。律师看案卷、研究人员梳理文献,这些场景体验会好许多。

然后是这个”Symphony架构”,名字挺唬人的,说人话就是——终于不用把图片转成”假文字”再处理了。
之前的多模态模型,处理图片实则是先把它翻译成文本形式再喂进去,处理视频得先抽帧。这么一转,信息多少会丢一些。Symphony的思路是让不同类型的数据(文字、图片、声音、视频)用更native的方式相互理解。
发布会上演示了几个场景:同时看懂视频里的画面+声音+字幕,根据一段音频的节奏感来生成图片,把PPT转成带配音的视频版。说实话,这些功能要是真能稳定跑起来,对做内容的朋友还是挺有用的。

性能数据这块,我挑重点说:
代码能力涨得猛,HumanEval通过率96.8%。这个意思是AI写的代码基本可以直接拿来用,不用怎么改。数学准确率92.5%,本科阶段的题基本能搞定。
但我觉得最有意思的是”复杂任务成功率75%”这个指标。翻译成人话就是:AI不只是能回答问题了,它能自己把一个大任务拆成好几个小步骤,调用不同工具,最后给你整出个完整的结果。这才是真正能省事的升级。

定价方面,输入2.5美元/百万Token,输出12美元/百万Token。
跟上一代基本持平,但性能涨了40%,等于加量不加价。OpenAI这波定价,我估摸着是被Claude逼的——人家Claude在企业市场已经占了73%的份额,OpenAI再不厚道点,真要被按在地上摩擦了。
而且200万Token的上下文没额外收费,这对需要处理长文档的企业用户挺友善的。
聊点题外话。
OpenAI目前实则挺难的。Anthropic年化收入已经破300亿美元,反超OpenAI成了行业老大。内部还走了好几个核心高管,包括之前负责模型安全的。这剧情,怎么看都有点像当年的苹果——乔布斯走了,库克接任,公司还在,但味道变了。
山姆·奥特曼说GPT-6的AGI完成度70%-80%。我就想问一下,那剩下的20%-30%卡在哪儿了?
说白了,AI目前能处理大部分脑力活,但遇到需要”生活常识”或者”理解物理世界”的任务,还是会犯迷糊。你让它写代码行,但你让它去厨房帮你做个三明治试试?

最后说下大家最关心的——什么时候能用上?
6月份开放API,企业客户可以先走专属通道测。普通用户的话,根据之前GPT-5的节奏,ChatGPT上免费用上估计得等3到6个月。
不着急的话可以先等等,等首批用户体验反馈出来再上手也不迟。这年头,新东西上手就翻车的例子太多了。
总的来看,这次GPT-6的升级的确 不是挤牙膏。200万Token上下文、Symphony架构、75%复杂任务成功率——这几个点单独拎出来不算惊艳,但凑在一起,对于天天用AI干活的人来说,感知会很明显。
至于AGI完成度70%这个数字嘛,听听就好。路还长着,且用且珍惜吧。

(完)