DeepSeek V4预览版,终于来了

DeepSeek V4预览版,终于来了

千呼万唤,千等万等,DeepSeek终于放出了V4预览版。

1、双模齐发:

Pro版,参数高达1.6T(MoE,激活49B)

Flash版,参数284B(MoE,激活13B)

2、百万超长上下文:

上下文长度高达1M,而且100万上下文是DeepSeek所有官方服务的标配。

也许你真的可以把整个代码仓库贴进去了。

3、性能对标西方顶尖模型:

挑战的都是Claude-Opus-4.6-Max,GPT-5.4-xHigh,Gemini-3.1-Pro-High。

只不过,闭源模型们也很卷,Claude已经4.7了,GPT也5.5了,一旦入场,真是逆水行舟不进则退。

4、高性价比:

目前大家都知道算力紧张,Tokens昂贵,DeepSeek又研发了一种新的省钱方法:全新注意力极致,在token维度进行压缩。

这也是DeepSeek V4能干100万超长上下文的关键。

5、Agent能力增强

针对Claude Code 、OpenClaw、OpenCode、CodeBuddy等主流的 Agent产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。

6、基于华为昇腾的优化

这个传闻已久,但这次DS不藏了,在提及价格的时候,有一行小字写的超级明显↓

字小事大:*受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

7、开源!开源!开源!

开源权重+本地化部署,新一代DeepSeek一体机可以走起了,这绝对是买盒子一族的巨大利好。

—————-

除了没有多模态,DeepSeek v4 已经给我们带来了足够惊喜,实则也不需要纠结,从某种意义上来讲,多模态实则更像昂贵的花瓶,你说呢?

这份等待,值了!

© 版权声明

相关文章

暂无评论

none
暂无评论...