DeepSeek V4上手实测:没能再次暴杀,但路子走对了
先说大家最关心的结论:V4没上演逆袭剧本。 没把Claude Sonnet 4.5甩身后,也没复刻当年R1干翻o1的名场面。在我这,它大致和GLM 5.1、Kimi K2.6坐一桌,算国产开源的第一梯队。

稍微有点可惜的是多模态,这次没上。体验下来,实话实说,没那种被核弹轰到脑瓜嗡嗡响的感觉。 不过看跑分,数学和推理这块,底子的确 挺硬。
但你看官方的发文标题——“百万上下文的普惠时代”,一下就清楚了。关键词不是“最强”,是“普惠”。长上下文外加一个亲民价,才是它手里攥的两张王牌。这么必定位,大伙心里就有数了:国内顶流没跑,世界顶流还得再冲冲。当然,实测里头也藏着些小惊喜。
说完定位,我们来盘一下价格
这次分了俩型号。Flash版,价格简直杀疯了,一两块钱搞定输入输出,比上一代还便宜。关键是,人家照样扛得住1M长上下文,这你受得了吗?“价格的普惠”这几个字,算是落到实处了。
按官方的说法,Flash和Pro主要差在世界知识上,Agent调度还有编程这块,一点都不弱。
另一个Pro版就金贵了,输入一块,输出二十四块,一口价买卖,没那些梯度收费的弯弯绕,同样支持百万上下文。
你可能会嘀咕:二十四块的输出价,可不低,跟竞品比甚至还小贵。但有一说一,DeepSeek跑分的确 也高些,纯按能耐来定价,倒也说得过去。还有一点很关键,瞅瞅别家长上下文模型,大多卡在两百K上下。国内你想找个又新、上下文又长的,除了它就剩阿里通义Qwen3.6 plus和Mimo V2.5 Pro了。这俩兄弟呢,一旦过了256K,价格立马起飞,真有点让人下不去手。所以你看,这就是V4“普惠”的实在意思。
官方也放风了,说下半年算力上来后,价格会大跳水。我私下也猜一猜,Pro的输出从24块打到8到12块,这可不是白日梦,算是个美好的愿望吧。

好,掰扯掰扯我都测了啥
动手测编程
这回我接上官方的API,用Claude Code跑的。先让它用Python整个美式鬼畜风的视频,Pro和Flash出来的东西都挺像样,各有各的出彩。打这起我就觉得,Flash写代码有两把刷子。
接着让它俩写“我的世界”网页前端:
- Pro: 第一次出来,人物不会动,但挖方块没问题,稍微提点一下立马改得漂美丽亮
- Flash: 初版是简陋了点,可上来就能玩,也算过关
最后试了把Agent技能调用,生成个蒸馏小工具。好家伙,Pro和Flash压根拉不开差距,调用都麻溜得很。就编码和Agent能力来说,这俩的差别远没定价差的那十倍夸张。
要我说,日常干的活儿,别多想,直接上Flash,Pro那是真有点烧钱。

然后就是大家常说的“人味”
这回合,Pro的知识储备是摁着Flash在地上摩擦。我甩了一大串谐音梗冷笑话过去,Pro跟个人精似的,基本秒懂,解释得比我想的还要到位。看来在中文理解这事上,Pro真有两下子。对照那些评测基准看,这就是典型的“力大砖飞”,参数量给足了,Flash的小脑袋瓜自然就不够用了,有些地方出了理解岔子。
我工作流里有个AI辅助的环节,DeepSeek V4 Pro是继Claude Opus 4.6之后,第二个我觉得真能顶上去的国产模型。 跟它聊,意见给得挺中肯,没那种小模型自带的“傻气”,能聊出点灵感来。更别说配上1M超长上下文,实际能聊的来回翻了个7到10倍,体验直线拉升。所以,“人味”这关,我给它过了。
当然,有惊吓也有惊喜:
- 惊吓: 玩脑筋急转弯,它老过度思考,能在一个没必要的地方纠结到天荒地老
- 惊喜: 玩“酒馆”那帮朋友告知我,V4指令遵循和记性都挺在线,对玩角色扮演的是大利好。还有眼尖的扒出来,V4藏了个角色扮演专用模式没开放。用API写提示词,还能碰运气唤出人物的内心OS。这说明啊,官方心里门儿清,知道自家用户好多是拿它写小说、玩扮演的,这点可以小期待一下
最后的重头戏:1M长上下文
这是我最盼着的功能。结果,有点泼冷水了。看网上各种“大海捞针”的测试分,都挺美丽的。可我一来真的,把快90万字的《武林外传》全剧本扔进去,连问三个一个比一个难的问题,就露怯了。
问题一: “炊事班的大周是干嘛的” → Gemini 3.1 Pro一下就逮住了,V4第一回愣没反应过来,追着问还认错人了。后面充了钱再问,答案对了一次,我剪视频回看的时候发现还是翻了车。
问题二: 回答照样缺胳膊少腿。
问题三: 开放题,没啥标答。我个人玩下来感觉,网页上白嫖直接问,好像还更靠谱点,API的精度反而差点意思。
只能等着他们再调了,毕竟长上下文是我最看重它的一点。
写在最后
好了,这期DeepSeek V4的提前摸底,就这么着吧。总的感觉是喜忧参半,我图的就是个真实。
最后还是想说,官方发文最后那句——
“不诱于誉,不恐于诽,率道而行,端然正己”

看着还是会让人心里一热。希望DeepSeek能带着这股劲儿,接着往前赶,接着超。