GPT-6 vs Claude Mythos，谁是当前最强AI？

从当前泄露的信息看，Claude Mythos在专业测试中展现更强能力，但GPT-6凭借即将发布和生态整合，在实用性上更占优势。这两款顶级模型代表了AI发展的不同方向，让“最强”的定义变得复杂。

能力巅峰对决

GPT-6被OpenAI内部定位为通往AGI的“最后一公里”。爆料显示，它采用原生多模态架构，统一处理文本、音频、图像和视频，上下文窗口高达200万Token，是前代的两倍。性能上，在代码、推理和智能体任务方面比GPT-5.4强了40%。

更关键的是，它旨在整合ChatGPT、Codex编程引擎和Atlas浏览器，构建一个超级智能体，从响应式对话转向实际任务执行，列如操控电脑完成跨应用工作流。

Claude Mythos则因配置错误意外泄露，露出惊人实力。测试表明，它在编程、学术推理和网络安全领域全面碾压当前最强的Claude Opus 4.6和GPT-5.4，综合能力提升40%以上。例如，在智能体编码基准测试中，Terminal-Bench 2.0得分78.4%，SWE-bench Verified达87.4%。

GPT-6 vs Claude Mythos，谁是当前最强AI？

其编程能力精通200多种语言，能独立开发大型软件，推理准确率超95%，被形容为“AI界核武器”。

安全与落地博弈

但强劲能力伴随巨大风险。Claude Mythos的网络攻击辅助能力——能自动识别漏洞、生成攻防脚本——让Anthropic“不敢发布”，担心引发网络安全危机。内部文件警告，它可能预示“一波AI驱动漏洞利用浪潮”，攻击速度远超防御能力。加上运行成本极高，目前仅向少量客户测试，大众难以触及。

GPT-6则更注重落地。预计于2026年4月14日正式发布，定价亲民，每百万Token输入2.5美元，输出12美元，基本与GPT-5.4持平，却对标Claude Mythos级别的智能。这意味着OpenAI在推动普惠化，让超级能力更易用。为了聚焦于此，公司甚至裁撤Sora等项目，重组为“AGI部署部”。

这场竞争本质是“极致专业”与“实用生态”的赛道分化，共同推动AI向更强劲、更安全的方向迈进。