Meta超级智能实验室的新模型在关键性能指标上已经超越了Llama 4。2026年1月,Meta首席技术官安德鲁·博斯沃思宣布,超级智能实验室(MSL)内部交付的首批AI模型——包括文本模型“鳄梨”(Avocado)和多模态模型“芒果”(Mango)——表现“超级出色”。
从技术参数到实际应用,这批新模型都标志着对前代产品的显著跨越。
技术架构的全面升级
新模型并非简单迭代,而是在Llama 4的混合专家(MoE)架构基础上实现了规模与效率的双重突破。参考文章显示,其总参数量可能突破2万亿级,而通过动态路由机制,每次推理仅激活约2880亿参数。

这继承了Llama 4 Maverick模型(总参4000亿,激活170亿)的高效设计,但在知识容量上实现了巨大跃迁。更关键的是,新模型支持超长上下文窗口,能力有望超越1000万tokens,相当于能处理约1.5万页文本或20小时视频内容,从根本上解决了传统大模型在长文档、代码库分析中的“短视”问题。
性能表现的显著飞跃
技术突破直接转化为硬核的性能优势。新模型采用原生多模态融合设计,通过早期融合技术(如MetaCLIP视觉编码器)将文本、图像和视频统一处理,使得模型能更自然地理解和生成跨模态内容。
在ChartQA、DocVQA等需要图文理解的基准测试中,其性能已超越了GPT-4o和Gemini 2.0 Flash等竞争对手。内部测试数据提供了更直接的对比:在复杂任务规划中,新模型的准确率较Llama 4提升40%,代码生成效率提高35%,已初步具备“数字员工”级别的自主执行能力。

商业落地与战略转身
超越不仅体目前实验室分数上,更已开始驱动Meta的核心业务。与以往开源的Llama系列不同,“鳄梨”和“芒果”标志着Meta AI战略的重大转变——转向闭源商业化模式,旨在提升商业变现能力,直接对标GPT-5和Gemini 3 Ultra。它们的价值正快速落地:
- 在Instagram的Reels内容生成场景中,应用新模型使生产效率提升了10倍。
- WhatsApp的点击广告营收增速也有望进一步提高,由于“鳄梨”模型旨在重构广告投放逻辑,让系统通过深度解析广告素材来判断“谁最可能转化”,而非依赖传统兴趣标签。
这一切的背后,是Meta通过“Meta Compute”计划进行的史诗级算力押注。2025年资本开支已达700-720亿美元,其中大部分投向AI算力,首个Prometheus超级集群(1GW)将于2026年上线,为新模型的训练和推理提供底层支撑。
尽管博斯沃思坦言模型研发“尚未完全结束”,但基于现有信息,新模型实现对Llama 4的超越已是清晰可见的趋势。