DeepSeek V4全面评测:代码能力登顶开源榜首,百万上下文普惠时代

内容分享2小时前发布
0 0 0

2026年4月24日,距离上一代大版本更新时隔15个月后,DeepSeek在无预热的情况下正式发布新一代旗舰大模型DeepSeek-V4预览版并同步开源。该系列包含V4-Pro与V4-Flash两个版本,均支持100万token超长上下文,采用MIT开源协议。其中V4-Pro拥有1.6万亿总参数,激活参数49B;V4-Flash总参数2840亿,激活参数13B。DeepSeek官方表明,1M上下文将成为所有官方服务的标配。

V4在第三方评测中表现亮眼。Vals AI的Vibe Code Benchmark测试中,V4以压倒性优势拿下开源权重模型榜首,击败了Gemini 3.1 Pro等闭源前沿模型,较前代V3.2实现约10倍的性能跃升。在代码竞技场上,V4 Pro位列开源模型第3位、综合第14位。在Agent能力方面,V4 Pro在Agent真实工作任务评测中以1554分领跑开源权重模型,超越Kimi K2.6等竞品。不过,其幻觉率高达94%至96%,知识准确性仍与顶级闭源模型有约3至6个月差距。

V4最引人注目的突破在于大幅降低了百万上下文的使用门槛。它首创了CSA与HCA混合注意力机制,在1M上下文下,V4-Pro单token推理算力仅为V3.2的27%,KV缓存仅10%。定价上延续了DeepSeek一贯的普惠路线:V4-Flash输出仅为2元/百万Token,V4-Pro输出24元/百万Token。发布后,DeepSeek随即推出V4-Pro限时2.5折优惠,持续至5月5日。

在生态适配方面,V4已全面适配华为昇腾全系列产品线。华为表明通过双方紧密协同,昇腾超节点全系列已支持V4系列模型部署。寒武纪、摩尔线程等国产算力玩家也迅速跟进适配。百度千帆等云服务商已同步上线V4的API服务。业内人士指出,DeepSeek-V4不仅是模型能力的跃升,更是国产大模型与国产算力底座深度协同的

DeepSeek V4全面评测:代码能力登顶开源榜首,百万上下文普惠时代

DeepSeek V4全面评测:代码能力登顶开源榜首,百万上下文普惠时代

标志性事件。

© 版权声明

相关文章

暂无评论

none
暂无评论...