阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

内容分享7个月前发布湖南卫视

9 20 0

全能 AI 聚合平台免费

一站式接入主流 AI 大模型，支持对话 · 生图 · 生视频，即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama

AI对话 AI生图 AI视频

免费使用 →

编辑：编辑部 HNYZ

【新智元导读】仅用32B，就击败o1-mini追平671B满血版DeepSeek-R1！阿里深夜重磅发布的QwQ-32B，再次让全球开发者陷入狂欢：消费级显卡就能跑，还一下子干到推理模型天花板！

凌晨，阿里重磅开源全球最顶尖AI模型——通义千问QwQ-32B推理模型。

它仅用320亿参数，便与目前公认的开源最强6710亿参数的满血版DeepSeek-R1（370亿被激活）相媲美。

甚至，QwQ-32B在多项基准测试中全面超越o1-mini。

更令人兴奋的是，任何人能够直接在搭载消费级显卡的电脑或者Mac上体验满血版性能。（终于，我们的5090D派上用场了）

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

左右滑动查看

更有开发者惊呼：AI模型彻底进入全民普及阶段！

如此来看，QwQ-32B简直堪称「推理能力天花板」与「实用性典范」的完美结合。

苹果机器学习研究员Awni Hannun用搭载MLX架构的M4 Max笔记本去跑QwQ-32B，结果发现运行超级流畅。

已经是上上代旗舰的3090 Ti，跑起模型来也超级之快——输出速度可达30+token/s。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

目前，阿里以宽松的Apache2.0协议将QwQ-32B全面开源，全球开发者与企业均可免费下载、商用。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

魔搭社区：

https://modelscope.cn/models/Qwen/QwQ-32B

Hugging Face：

https://huggingface.co/Qwen/QwQ-32B

当然了，所有人皆可通过通义APP免费体验最新的千问QwQ-32B模型，开启方式——Qwen2.5 Plus+Thinking（QwQ）。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

体验地址：

https://chat.qwen.ai/?models=Qwen2.5-Plus

开源新王诞生，32B媲美DeepSeek-R1

QwQ-32B到底有多强？我们用数据来说话——

在数学AIME 2024评测集，以及评估代码LiveCodeBenc基准上，QwQ-32B均与DeepSeek-R1旗鼓相当。

而且，其性能远超o1-mini，甚至是一样尺寸基于Qwen系列蒸馏出的R1模型。

在LeCun领衔的「最难LLMs评测榜」LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由UC伯克利等提出的评估准确调用函数或工具方面的BFCL测试中，QwQ-32B得分均超越了DeepSeek- R1。

总的来说，QwQ-32B在数学、编程、通用能力方面取得了领先优势。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

正是通过RL的Scaling，QwQ-32B才能实现能与DeepSeek-R1相匹敌的性能。

艾伦人工智能研究所大佬Nathan Lambert发自内心地赞叹：「QwQ-32B是给RL纯粹主义者最好的礼物。」

大佬开始仔细研读阿里放出的官方材料，并且敲桌板表明：我们需要更多论文！

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

接下来，是对QwQ-32B的最新实测。

我们已经部署在电脑里了

第一，来一段难度不低的数学题。

n个点在一个圆中，点出目前圆中的位置是随机的，求这些点出目前同一个半圆内的概率。

QwQ-32B在经过一大长串的思考之后，给出了正确答案。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

同一道题，我们也在本地部署的Q4量化模型上进行了验证。

虽然由于没优化本地环境导致输出较慢，但QwQ-32B依然一次就做对了。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

而OpenAI o3-mini-high可能觉得这道题超级简单，只思考了几秒，就开始作答。

最后，果不其然答错了。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

上下滑动查看

接下来是一道微积分，看它能不能解决高等数学问题。

可以看出，不管是本地部署的还是线上的QwQ-32B，都有着逻辑严谨、步骤清晰的解题过程。

从明确目标到巧妙变量代换u = xe^x，再到逐步推导和结果验证，成功将复杂积分转化为简单的对数形式，结果完全正确！

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

同样的提示给到蒸馏版DeepSeek-R1-32B。

可以看到，它在经过了漫长的思考之后，并没有做对。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

而最有趣的，还得是OpenAI o1。

它不仅答案不对，而且两次都只说了个思路，剩下的……你自己去解吧。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

再上一道推理题。

一群人开舞会，每人头上都戴着一顶帽子帽子只有黑白两种，黑的至少有一顶。每个人都能看到其它人帽子的颜色，却看不到自己的主持人。先让大家看看别人头上戴的是什么帽子，然后关灯，如果有人认为自己戴的是黑帽子就打自己一个耳光。第一次关灯，没有声音于是再开灯，大家再看一遍，关灯时依旧鸦雀无声。一直到第三次关灯，才有劈劈啪啪打耳光的声音响起。问有多少人戴着黑帽子?

在思考过程中，QwQ-32B进行了逻辑严密的推断。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

上下滑动查看

最终，它给出了正确答案：3人戴着黑帽子。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

本地模型同样回答正确。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

而在实测过QwQ-32B的写作能力后，我们忍不住赞叹：国内的大模型中，又出了一个思想和文笔俱佳的文科生！

此前，DeepSeek-R1仿《过秦论》的风格写出的《过美利坚论》技惊四座，文采斐然。

目前让QwQ-32B接受同样的考验。

可以看到，它第一分析了贾谊《过秦论》的特点——多用排比、对仗，气势磅礴，语言犀利。然后想到，自己需要思考如何将美国的历史事件与《过秦论》的结构对应起来。

难点就在于，要用文言文准确表达一些现代概念，还要保证论点有逻辑性、层层递进。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

一番思考之后，QwQ-32B给出的回答果然精彩，文采丝毫不输DeepSeek-R1。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

相比之下，用于技术验证的蒸馏版DeepSeek-R1-32B，在文采上就要稍逊一筹了。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

另一个DeepSeek-R1惊艳全网的「续写红楼梦后八十回」，我们也把同样的题交给了QwQ-32B，让它续写红楼梦的第八十一回。

它在思考过程中，思考到自己需要延续前作细腻的描写、复杂的人物关系和隐喻，还要回应埋下的伏笔，列如贾府的衰落、宝黛的爱情悲剧等。

甚至它还分析出，自己还要表现出原著的悲剧色彩和深刻的批判；如果要引入新角色或事件，就必须自然融入现有框架，不能突兀。

经过这番思考后，它列出了第八十一回的故事梗概，看起来很像那么回事。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

而按照这个梗概续写的正文框架，虽然仍不及原作文笔，但已不无可取之处。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

上下滑动查看

无需集群，笔记本都能跑

众所周知，满血版DeepSeek-R1超级强劲，但671B参数量所带来的庞大体积，使得它在本地部署起来十分吃力。

Hugging Face工程师Matthew Carrigan的部署过程，就是一个很好的参考。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

想要在GPU上实现720GB（Q8量化）的显存，花费可能要10万美元以上。

当然，也可以另辟蹊径地使用CPU进行部署，只不过生成的速度会慢许多。此时，需要24条32GB的内存才能装下。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

即便是Q4量化的版本DeepSeek-R1-Q4_K_M，也得需要404GB，依旧不小。

以谷歌开发者专家、UCL计算机系博士生Xihan Li的部署实操为例。

除了模型参数占用的内存+显存空间（404GB）以外，实际运行时还需额外预留一些内存（显存）空间用于上下文缓存（总计约500GB）。

在4×24GB显卡（RTX 4090）和4×96GB内存配置下，DeepSeek-R1-Q4_K_M的短文本生成的速度只有2-4 token/秒，长文本生成时速度会降至1-2token/秒。基本不可用。

相比之下，QwQ-32B本地部署则友善的多，消费级GPU单卡就能轻松部署，而且速度飞起！

列如，在Hugging Face上开源的QwQ-32B版本，以Q4量化精度为例，大小不到20GB。

不只是4-bit量化的版本，Hugging Face上还有从2位一直到8位不同的版本，最小仅需不到13GB，将本地部署的难度直接拉到最低！普通的办公电脑都能运行得起来。

本地部署后，加载与运行也是相当的容易，十几行代码就能完成模型加载、处理问题并生成答案。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

Ollama也上线了Q4版本的QwQ-32B模型，安装Ollama后只需复制ollama run qwq到终端，即可体验，简直没有门槛。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

Nous Research的常驻研究员N8 Programs在X上称赞QwQ-32B真是一个令人难以置信的进步。

他展示的是前沿推理模型在LiveBench上的得分（下图）——LiveBench是一个全面的在线评估测试，覆盖了广泛的领域（并且一般与实际情况相符）。

可以看到，QwQ-32B的得分介于R1和o3-mini之间，但成本却只有它们的十分之一。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

强化学习「炼丹」，小模型也能逆袭

DeepSeek爆火之后，强化学习再次回到聚光灯之下，成为提升大模型/推理模型的关键钥匙。

QwQ-32B成功的核心秘诀，便在于阿里云团队开创性运用了大规模强化学习技术。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

不过，与传统方法不同的是，他们采用了多阶段RL训练策略。

在初始阶段，基于冷启动数据，针对数学、编程、通用任务上，进行了强化学习训练。

相较于传统的奖励模型，团队创新性通过校验答案正确性（数学任务）和代码执行测试（编程任务）提供反馈，确保模型逐步「进化」。

在RL Scaling过程中，随着训练轮次推进，模型在数学、编程两个领域的性能持续提升。

在第二阶段，研究人员又针对通用能力进行了RL训练，主要使用通用奖励模型和一些基于规则的验证器进行训练。

实验显示，通过少量步骤的通用 RL，可以提升QwQ-32B的通用能力，最关键的是，其数学、编程性能没有显著下降。

QwQ-32B仅在320亿参数规模下，推理能力直逼DeepSeek-R，恰恰验证了「大规模强化学习+强劲基座模型」是通往AGI的关键路径。

此外，QwQ-32B不只是一个推理模型，还集成了先进的Agent相关能力。不仅在使用工具时批判性思考，还能根据环境反馈动态调整策略。

下一步，阿里还将继续探索智能体与强化学习的深度融合，目标直指长时推理，最终实现AGI。

开源先锋，引领全球AI新格局

这次QwQ-32B满血版开源，绝不是个例，而是阿里云开源战略中的一个环节。

在全球人工智能浪潮席卷之下，开源早已成为推动技术创新的重大引擎。

作为国内最早开源自研大模型的「大厂」，阿里云也是全球唯一一家积极研发先进AI模型，且全方位开源的云计算厂商。

自2023年8月以来，通义系列累计推出了从Qwen、Qwen1.5、Qwen2到Qwen2.5数十款大模型，覆盖5亿到千亿级别的参数规模，并开源了超200款模型，支持29种语言。

这一壮举，标志着阿里云在业界率先实现了「全尺寸、全模态、多场景」的开源。

开源的Qwen系列凭借卓越的性能，数次登顶国内外权威榜单，还多次冲上HuggingFace、Github热榜，成为开发者心中的「爆款」。

2024年，仅Qwen2.5-1.5B一款模型就占据了HuggingFace全球模型下载量的26.6%，位列第一。

才刚刚开源的QwQ-32B，就已经有众多来自不同国家、说着不同语言的的开发者，在第一时间都直接用上了，而且好评如潮。

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

左右滑动查看

我们都知道，开源的真谛在于，众人拾柴火焰高。

目前，Qwen衍生模型数量突破10万，远超Llama系列，成为全球最大的生成式语言模型族群。

阿里云的开源战略不仅体目前技术输出，更在于推动普惠AI的初心——让中小企业和开发者能够以最低成本、更快速度用上AI，加速大模型应用落地。

另外，通过魔搭ModelScope社区，阿里云还联合1000万开发者，打造出中国最大的AI开源生态。

阿里云坚信，开源是推动技术创新的关键。

通义千问系列的开源，不仅仅是一场技术狂欢，更是一次生态革命。从技术突破到生态赋能，他们正用实际行动诠释了技术普惠的深刻内涵。

正如其愿景所言，通过开源与合作，推动中国大模型生态的繁荣，助力全球AI技术迈向新高度。

在这条路上，通义千问无疑成为一颗耀眼的明星，照亮了AI的未来。

参考资料：

https://chat.qwen.ai/

内容分享

文章版权归作者所有，未经允许请勿转载。

AI硬件解决方案，你们需要定制什么产品，我们都有方案！ Wi-Fi模块：双模加蓝牙，满足不同场景需求

8个月前

030

GEO内容生产的技术重构：从”写得多”到”被AI选中”的范式转换

内容分享

1周前

030

解码 AI Agent 的底层逻辑与进化之路

内容分享

3个月前

160

C语言的简单了解及学习2

内容分享

4个月前

060

20 条评论

琳琳要快乐噢投稿者

试过了，生成文字的速度太慢

7个月前无记录

回复
抓马黛安娜投稿者

小模型比肩大模型，QwQ-32B 厉害！

7个月前无记录

回复
巨无小虫虫儿读者

取经都需要付出紫金钵盂悲哀

7个月前无记录

回复
小菌评论投稿者

速度还是慢

7个月前无记录

回复
魔力春天就是我读者

本地装一个试一下，所有现有的王者都是暂时的，AI 本来就发展快，更强的正排着队在路上

7个月前无记录

回复
与鱼语宇0824 投稿者

最大的特色其实是算力资源的降低，消费级GPU可支撑常规调用，行业级平台应用适配广，比MANUS更亲民。

7个月前无记录

回复
睡觉喵丶读者

测试过了，比肩不了。还是DeepSeek-R1 推理能力更强！

7个月前无记录

回复
聆听的雨声读者

什么样的笔记本本能跑？

7个月前无记录

回复
小紫读者

我突然想到了大跃进，希望科技界稳重一点

7个月前无记录

回复
默默读者

没那么简单，阿里的地基离不开英伟达GPU，等到与国产芯片适配再说吧

7个月前无记录

回复
梨子君不吃梨子投稿者

测试了，跟deepseek32b一个水平，让它查本地知识库，使劲给我总结，说了也不听教

7个月前无记录

回复
花哥探悦者读者

这只能说明基准测试已经没有参考意义了

7个月前无记录

回复
朱梅花读者

真是特色，只要一家火了各种牛逼的公司就出来了。

7个月前无记录

回复
丽影芳华读者

看来deepseek r2 马上要和大家见面了。

7个月前无记录

回复
DuunDunu 投稿者

试了一下QwQ-32B效果很差，幻觉更加严重，输出都是不靠谱的信息，没有一个对的。

7个月前无记录

回复
行痴·知无畏投稿者

本地跑有啥好处我用现成的不好？

7个月前无记录

回复
兴国读者

编程代码DS满血版大部分都能一次过，国内其他没见到能与之相提并论的，包括百度专门AI代码的都不行。国外试了试就Claude挺好，我用这两个编的程序既准确又好看，真的超棒！其他的大部分都是一塌糊涂。

7个月前无记录

回复
思想饭读者

对比过相同参数和相同量化的DeepSeekR1，QwQ的推理时间明显长，所以相同参数下产出的质量更高。

7个月前无记录

回复
紫薇忘了水葫芦读者

32b的模型至少需要20+g的显存，普通笔记本能跑？

7个月前无记录

回复
好运小饭投稿者

真的比deepseek-R1要好吗

7个月前无记录

回复

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

一文读懂AI人工智能系统之CV计算机视觉大模型

如何通过提示工程构建大模型（LLM）应用

相关文章

AI硬件解决方案，你们需要定制什么产品，我们都有方案！ Wi-Fi模块：双模加蓝牙，满足不同场景需求

GEO内容生产的技术重构：从”写得多”到”被AI选中”的范式转换

解码 AI Agent 的底层逻辑与进化之路

C语言的简单了解及学习2

20 条评论

热门网站

LuKuai 免费AI对话聊天平台

DeepSeek

ChatGPT

Claude

Grok

Shopee

热门文章

昆廷夫夫日常合集：昆廷夫妇全集免费直通车1080P超速播-未删减百度云秒拉缓存-高清画质自由看-可影视全网极速播放昆廷夫夫日常合集-昆廷夫妇全集在线点播免VIP高清未删减版-可影视秒播

【办公类-54-08】20250831Deepseek编写Python代码制作各班的周计划基础信息（户外运动、自主游戏、个别化）

OpenAI 每周为 4 亿用户提供服务

太好了是AI大学生有救了

Kafka 消费Lag监控

第12章串行通信接口与异步传输技术

阿里千问QwQ-32B开源，比肩671B满血DeepSeek-R1！笔记本就能跑

一文读懂AI人工智能系统之CV计算机视觉大模型

如何通过提示工程构建大模型（LLM）应用

相关文章

热门网站

LuKuai 免费AI对话聊天平台

DeepSeek

ChatGPT

Claude

Grok

Shopee

热门文章

标签云