千呼万唤,DeepSeek V4终于发布,更令人瞩目的是它和华为昇腾算力的世纪握手。
这不仅是模型迭代,更可能是一次算力生态的深层重构。

在进入正题前,先分享一段话。
今天发布的《DeepSeek V4预览版迈入百万上下文普惠时代》一文中,最后有这样一句:“不用于御物,恐于诽,率道而行,端然正己。”
读来不禁令人肃然起敬,这似乎也恰是这支团队的行事底色。

那么,DeepSeek V4到底牛在哪里?它全面拥抱华为昇腾CANN生态会带来哪些利好?下半年华为昇腾950超节点批量上市,又可能埋下哪些机会?我们逐一展开。
先看DeepSeek V4的核心亮点。

模型总参数量高达1.6万亿,这次按规模直接分为两个版本,旗舰版V4 Pro和经济版V4 Flash。
它的出现,像是在原本由欧美大厂垄断的高端牌桌上,直接掀了桌子。
它究竟有什么魔力?挑几个最核心的特点通俗地解释一下。

第一个特点,100万超长上下文成了免费标配,相当于给AI装上了过目不忘的超大内存。
过去,想让AI一次性处理几十万甚至上百万字的长篇报告,属于VIP付费高级功能,价格不菲。
但DeepSeek V4开创了一种全新的混合注意力机制,即CSA加HCA。

这怎么理解?
假设你要读一本100万字的厚书,每个字都咬文嚼字地进行高精度计算,大脑肯定会死机,算力和存储也会爆炸。
DeepSeek V4的做法是,对关键的词句采用精读模式,也就是CSA压缩稀疏注意力,对不那么重大的部分采用泛读模式,也就是HCA重压缩注意力,大幅降低精度。

这种精读加泛读的机智机制,让V4的token计算量直接减少了27%,内存占用减少10%。
最终的结果是,100万字长文本处理直接变成基础免费功能,每次调用API都能无门槛享受完整的百万上下文窗口,无需额外掏一分钱。
这与西方大语言模型按量高收费的做法截然不同。

第二个特点,平民白菜价,对西方闭源大模型形成降维打击。
或许许多人不清楚西方顶尖模型有多贵,以最新一代的Claude Opus 4.7和GPT-6为例,每输出100万token的收费大约在25到30美元。
而DeepSeek V4 Pro旗舰版仅需3.48美元,成本直接降低七到九倍。

更轻量的V4 Flash更是低至0.28美元。
DeepSeek最厉害的武器,或许不是模型本身,而是递给所有技术负责人的那张报价单。
当性能与国外顶尖选手持平,甚至在代码和数学推理上处于领先地位,价格却只有对方的八分之一时,国外大厂的高定价策略还能维持多久?

第三个特点,精准的双车战略,兼顾跑车与代步车。
V4的双层结构很清晰,V4 Pro是超级跑车,专攻复杂的数学、竞技编程和深度智能体任务,V4 Flash则是国民代步车,体积小、速度极快、价格极低,虽然不擅长深度复杂思考,应对日常工作却绰绰有余。

这次发布会还藏着一个震撼行业的秘密,DeepSeek V4完全基于华为昇腾950P2芯片运行,技术架构从英伟达的CUDA转向了华为的CANN。
怎么理解这个转变的意义?
可以把英伟达的CUDA比作苹果的iOS,过去大家做AI只能在这个系统里玩。

目前,DeepSeek带着万亿参数的超大模型,硬生生把系统切换到了华为的CANN,类似于切换到鸿蒙。
这是全球首个在国产算力底座上完成训练和推理的万亿级模型。
更绝的是,单卡推理性能居然达到了英伟达H20芯片的2.87倍,单机算力成本下降了大约40%。

这40%的成本下降意义非凡,意味着国产算力在经济性上迎来了拐点,真正具备了大规模商用的性价比。
围绕DeepSeek与华为昇腾CANN这条主线,哪些公司值得重点关注?
DeepSeek官方也坦言,受限于高端算力,V4 Pro版推理服务的吞吐量目前还比较有限。

但好戏在后头,真正的超级催化剂预计在今年下半年,华为昇腾950超节点将批量上市。
什么是超节点?

国产单卡算力性能或许比不上英伟达最顶尖的卡,怎么办?大力出奇迹。
把成千上万张卡通过极高带宽绑在一起,构成一个超级蜂巢大脑,这就是超节点。
昇腾A3和950超节点采用全局内存统一编址,带宽高达惊人的784GB每秒,这正是国产算力弯道超车的核心路径。

到今年下半年,随着字节跳动、腾讯等互联网大厂完成验证,开始几万张甚至十万张级别的下单,超节点将迎来大规模交付。
这将利好以下几个产业链核心环节。

核心环节一,超节点整机以及服务器集成。
这些公司直接拿芯片做成整机卖给大客户,业绩弹性最大。
拓维信息是昇腾生态的钻石级伙伴,不仅自研服务器,还是Atlas 950的核心供应商,手中已中标80亿的计算订单。

软通动力旗下的软通华方已发布搭载昇腾950P2的AI服务器,并已部署到多个智算中心。
神州数码作为昇腾的总经销商,市占率极高,手握大量政务AI订单。
核心环节二,高速互联产业链。

成千上万张卡协同工作,传递数据的通路必须极度宽阔,超节点内部需要大量高速互联。
华丰科技是高速背板连接器供应商,其Connect Trade产品深度受益于昇腾950放量,在手订单充裕,是高速线模组的绝对核心。

在高速光互联领域,机构预计份额超过30%。中际旭创更是世界级龙头,被机构视为昇腾老一代超节点的独家1.6T光模块供应商,目前正面向950超节点持续布局。
亿华股份提供高速互连连接器,菲林斯科则提供配合昇腾网络设备升级的交换机。

核心环节三,生态合作和模型迁移。
东方国信与华为昇腾全栈合作,具备大规模从CUDA向CANN的模型迁移交付能力,正在筹建内蒙古智算中心,并收购C端算力平台AutoDL。
叠加算力银行加算力超市的模式,契合普惠算力的政策方向。

参考信息:
DeepSeek V4背后,梁文锋的转身

科技连线|DeepSeek V4上线,AI世界正在改变的规则
