2026年5月,一位开发者同时测试两款AI大模型:马斯克xAI刚发布的Grok4.3,以及中国公司深度求索的DeepSeek-V4-Pro。他的任务很简单:写一段复杂的代码,再生成一份财务分析报告。
结果,Grok4.3在代码任务上磕磕绊绊,而DeepSeek-V4-Pro不仅代码准确率更高,生成报告的速度也快了近一倍,成本却只有前者的几十分之一。这位开发者随后在论坛上分享了他的发现,而他的测试结果,恰好与一份刚出炉的全球AI大模型权威榜单不谋而合。
榜单上的“中游选手”:Grok4.3的真实处境
在权威评测机构Artificial Analysis 2026年5月发布的“全球AI大模型智能指数”榜单上,Grok4.3的综合得分为53分,排名全球第10位。
这个分数比它自己的上一代产品提升了4分,进步是有的,尤其是在“真实工作”场景评测中,其得分从1179跃升至1500,意味着在撰写营销文案、制作PPT这类实际任务上,它击败上一代自己的胜率超过了87%。
不过,问题在于赛场上的对手跑得更快。
在它身前,除了OpenAI的GPT-5.5、Anthropic的Claude Opus这些美国顶尖闭源模型,赫然还列着三家中国公司的名字:小米MiMo-V2.5-Pro、DeepSeek-V4-Pro和智谱GLM-5.1。这意味着,Grok4.3不仅离第一梯队有距离,甚至已经被挤到了全球前十的守门员位置。

领先的不仅是分数,更是背后的“团队协作”模式
为什么这些国产模型能跑到前面?一个核心的差异在于“造模型”的思路,这有点像组建一支团队。
- 国产模型的“专业团队”模式:以领先的DeepSeek-V4-Pro为例,它采用了名为“混合专家”(MoE)的架构。你可以把它想象成一个由许多专业顾问组成的团队,有编程专家、数学专家、文案专家。每次接到任务,系统只调用最相关的几个“专家”来工作。
这样做的好处是,既能处理极其复杂的任务(1.6万亿参数总量),又能保持高效率、低成本,其推理成本仅为同类美国模型Claude的1/40。这种架构让它在编程、数学推理等硬核任务上得分超过了90%和75%,实现了对GPT-5.2等国际头部模型的超越。
- Grok4.3的“全能单人”模式:相比之下,Grok4.3推测仍采用较为传统的“密集型”架构。这就好比一个尝试掌握所有技能的全才,无论任务是什么,都需要调动整个大脑来应对。
虽然它在遵循用户指令、完成客服对话等特定任务上表现顶尖(指令跟随能力获评全榜第一),但在需要深度推理和复杂逻辑的任务上,就显得力不从心,例如在需要编写和调试终端命令的测试中,得分只有38%。
所以,Grok4.3的“落后”,本质上是两种技术路径在效率与能力上限上的差距。当中国模型用“专业团队”模式实现降本增效时,传统架构在同等算力下已经触及了天花板。
一场“下载量超过4亿次”的生态超越
技术领先是单点突破,而国产AI的胜利,更是一场生态的全面超越。这组数字能让你感受到规模:
根据《ATOM Report 2026》的数据,截至2026年3月,中国开源AI模型的累计下载量已达到11.5亿次,而美国是7.23亿次,差距超过了4亿次。其中,阿里的通义千问(Qwen)系列模型累计下载量是Meta的Llama系列的近两倍。

这意味着什么?
- 开发者的选择:全球的开发者和企业正在用下载和使用的实际行动,为中国AI模型投票。更高的下载量意味着更丰富的应用场景、更多的反馈和更快的迭代速度。
- 市场的统治力:在更大的AI应用市场,中国模型的领先优势同样明显。全球最大的AI模型API平台OpenRouter数据显示,中国模型的周调用量在2026年已多次超越美国,推理Token(使用量)的市场份额占比达到了72.7%。

- 成本与普及的双重碾压:中国模型不仅性能强,价格也更“卷”。DeepSeek-V4-Pro的API价格极具竞争力,而Grok4.3虽然也较上代降价了60%,但在成本控制上依然面临巨大压力。
这使得国产模型能够快速渗透到中小企业乃至个人开发者中,形成了“小模型普惠应用 + 大模型攻坚克难”的健康生态格局。
从“追赶者”到“定义者”,格局已经改变
因此,Grok4.3排名第10并被三款国产模型超越,并非一次偶然的失利。它揭示了一个更深层的趋势:在AI大模型这场马拉松中,中国已经从长期的“追赶者”,变成了部分领域的“领跑者”甚至“定义者”。

约翰内斯堡大学教授史蒂文·博伊基·锡德利指出,中国AI的优势是全面的,建立在庞大的科研产出、技术积累和人才供给之上,而西方舆论长期低估了其发展速度。斯坦福大学的《2026年AI指数报告》也承认,中美顶尖模型之间的性能差距已经微乎其微。
对于用户而言,这意味着未来当你使用AI工具时,很可能会越来越多地接触到背后技术更强、成本更低、更懂中文场景的国产引擎。Grok4.3的这次排名,就像赛程中的一个醒目路标,它告知我们,全球AI竞赛的领跑集团已经扩容,而比赛的规则,也正在被新的力量所改写。


