炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

全能 AI 聚合平台 免费

一站式接入主流 AI 大模型,支持对话 · 生图 · 生视频,即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama
AI对话 AI生图 AI视频
免费使用 →

千呼万唤,DeepSeek V4终于发布,更令人瞩目的是它和华为昇腾算力的世纪握手。

这不仅是模型迭代,更可能是一次算力生态的深层重构。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

在进入正题前,先分享一段话。

今天发布的《DeepSeek V4预览版迈入百万上下文普惠时代》一文中,最后有这样一句:“不用于御物,恐于诽,率道而行,端然正己。”

读来不禁令人肃然起敬,这似乎也恰是这支团队的行事底色。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

那么,DeepSeek V4到底牛在哪里?它全面拥抱华为昇腾CANN生态会带来哪些利好?下半年华为昇腾950超节点批量上市,又可能埋下哪些机会?我们逐一展开。

先看DeepSeek V4的核心亮点。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

模型总参数量高达1.6万亿,这次按规模直接分为两个版本,旗舰版V4 Pro和经济版V4 Flash。

它的出现,像是在原本由欧美大厂垄断的高端牌桌上,直接掀了桌子。

它究竟有什么魔力?挑几个最核心的特点通俗地解释一下。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

第一个特点,100万超长上下文成了免费标配,相当于给AI装上了过目不忘的超大内存。

过去,想让AI一次性处理几十万甚至上百万字的长篇报告,属于VIP付费高级功能,价格不菲。

但DeepSeek V4开创了一种全新的混合注意力机制,即CSA加HCA。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

这怎么理解?

假设你要读一本100万字的厚书,每个字都咬文嚼字地进行高精度计算,大脑肯定会死机,算力和存储也会爆炸。

DeepSeek V4的做法是,对关键的词句采用精读模式,也就是CSA压缩稀疏注意力,对不那么重大的部分采用泛读模式,也就是HCA重压缩注意力,大幅降低精度。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

这种精读加泛读的机智机制,让V4的token计算量直接减少了27%,内存占用减少10%。

最终的结果是,100万字长文本处理直接变成基础免费功能,每次调用API都能无门槛享受完整的百万上下文窗口,无需额外掏一分钱。

这与西方大语言模型按量高收费的做法截然不同。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

第二个特点,平民白菜价,对西方闭源大模型形成降维打击。

或许许多人不清楚西方顶尖模型有多贵,以最新一代的Claude Opus 4.7和GPT-6为例,每输出100万token的收费大约在25到30美元。

而DeepSeek V4 Pro旗舰版仅需3.48美元,成本直接降低七到九倍。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

更轻量的V4 Flash更是低至0.28美元。

DeepSeek最厉害的武器,或许不是模型本身,而是递给所有技术负责人的那张报价单。

当性能与国外顶尖选手持平,甚至在代码和数学推理上处于领先地位,价格却只有对方的八分之一时,国外大厂的高定价策略还能维持多久?

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

第三个特点,精准的双车战略,兼顾跑车与代步车。

V4的双层结构很清晰,V4 Pro是超级跑车,专攻复杂的数学、竞技编程和深度智能体任务,V4 Flash则是国民代步车,体积小、速度极快、价格极低,虽然不擅长深度复杂思考,应对日常工作却绰绰有余。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

这次发布会还藏着一个震撼行业的秘密,DeepSeek V4完全基于华为昇腾950P2芯片运行,技术架构从英伟达的CUDA转向了华为的CANN。

怎么理解这个转变的意义?

可以把英伟达的CUDA比作苹果的iOS,过去大家做AI只能在这个系统里玩。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

目前,DeepSeek带着万亿参数的超大模型,硬生生把系统切换到了华为的CANN,类似于切换到鸿蒙。

这是全球首个在国产算力底座上完成训练和推理的万亿级模型。

更绝的是,单卡推理性能居然达到了英伟达H20芯片的2.87倍,单机算力成本下降了大约40%。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

这40%的成本下降意义非凡,意味着国产算力在经济性上迎来了拐点,真正具备了大规模商用的性价比。

围绕DeepSeek与华为昇腾CANN这条主线,哪些公司值得重点关注?

DeepSeek官方也坦言,受限于高端算力,V4 Pro版推理服务的吞吐量目前还比较有限。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

但好戏在后头,真正的超级催化剂预计在今年下半年,华为昇腾950超节点将批量上市。

什么是超节点?

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

国产单卡算力性能或许比不上英伟达最顶尖的卡,怎么办?大力出奇迹。

把成千上万张卡通过极高带宽绑在一起,构成一个超级蜂巢大脑,这就是超节点。

昇腾A3和950超节点采用全局内存统一编址,带宽高达惊人的784GB每秒,这正是国产算力弯道超车的核心路径。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

到今年下半年,随着字节跳动、腾讯等互联网大厂完成验证,开始几万张甚至十万张级别的下单,超节点将迎来大规模交付。

这将利好以下几个产业链核心环节。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

核心环节一,超节点整机以及服务器集成。

这些公司直接拿芯片做成整机卖给大客户,业绩弹性最大。

拓维信息是昇腾生态的钻石级伙伴,不仅自研服务器,还是Atlas 950的核心供应商,手中已中标80亿的计算订单。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

软通动力旗下的软通华方已发布搭载昇腾950P2的AI服务器,并已部署到多个智算中心。

神州数码作为昇腾的总经销商,市占率极高,手握大量政务AI订单。

核心环节二,高速互联产业链。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

成千上万张卡协同工作,传递数据的通路必须极度宽阔,超节点内部需要大量高速互联。

华丰科技是高速背板连接器供应商,其Connect Trade产品深度受益于昇腾950放量,在手订单充裕,是高速线模组的绝对核心。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

在高速光互联领域,机构预计份额超过30%。中际旭创更是世界级龙头,被机构视为昇腾老一代超节点的独家1.6T光模块供应商,目前正面向950超节点持续布局。

亿华股份提供高速互连连接器,菲林斯科则提供配合昇腾网络设备升级的交换机。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

核心环节三,生态合作和模型迁移。

东方国信与华为昇腾全栈合作,具备大规模从CUDA向CANN的模型迁移交付能力,正在筹建内蒙古智算中心,并收购C端算力平台AutoDL。

叠加算力银行加算力超市的模式,契合普惠算力的政策方向。

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

参考信息:

DeepSeek V4背后,梁文锋的转身

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

科技连线|DeepSeek V4上线,AI世界正在改变的规则

炸了!DeepSeek V4 重磅发布,牵手华为昇腾,直接掀翻欧美大厂垄断

© 版权声明

相关文章

暂无评论

none
暂无评论...