Meta超级智能实验室新模型能超越Llama 4吗？

Meta超级智能实验室的新模型在关键性能指标上已经超越了Llama 4。2026年1月，Meta首席技术官安德鲁·博斯沃思宣布，超级智能实验室（MSL）内部交付的首批AI模型——包括文本模型“鳄梨”（Avocado）和多模态模型“芒果”（Mango）——表现“超级出色”。

从技术参数到实际应用，这批新模型都标志着对前代产品的显著跨越。

技术架构的全面升级

新模型并非简单迭代，而是在Llama 4的混合专家（MoE）架构基础上实现了规模与效率的双重突破。参考文章显示，其总参数量可能突破2万亿级，而通过动态路由机制，每次推理仅激活约2880亿参数。

这继承了Llama 4 Maverick模型（总参4000亿，激活170亿）的高效设计，但在知识容量上实现了巨大跃迁。更关键的是，新模型支持超长上下文窗口，能力有望超越1000万tokens，相当于能处理约1.5万页文本或20小时视频内容，从根本上解决了传统大模型在长文档、代码库分析中的“短视”问题。

性能表现的显著飞跃

技术突破直接转化为硬核的性能优势。新模型采用原生多模态融合设计，通过早期融合技术（如MetaCLIP视觉编码器）将文本、图像和视频统一处理，使得模型能更自然地理解和生成跨模态内容。

在ChartQA、DocVQA等需要图文理解的基准测试中，其性能已超越了GPT-4o和Gemini 2.0 Flash等竞争对手。内部测试数据提供了更直接的对比：在复杂任务规划中，新模型的准确率较Llama 4提升40%，代码生成效率提高35%，已初步具备“数字员工”级别的自主执行能力。

Meta超级智能实验室新模型能超越Llama 4吗？