
引言/导读
在过去几年中,AI计算硬件市场几乎被一家巨头——NVIDIA——所主导。凭借其高达94%的市场份额,以及长期建立的CUDA软件生态系统,NVIDIA构建了一道看似不可逾越的“护城河”。然而,科技竞赛的叙事总是充满转折。近期,沉寂已久的挑战者AMD,突然凭借一项与AI领军企业OpenAI达成的惊人战略合作,以前所未有的姿态回到了聚光灯下。这项潜在价值高达1000亿美元的合作,不仅涉及下一代AI硬件的设计,更包含以公司10%股权作为对价的激励条款。
这篇文章将深入分析AMD如何从市场“陪跑者”进行绝地反击,NVIDIA的垄断壁垒究竟有多坚固,以及OpenAI的这项大胆举动,将如何重塑AI时代的硬件生态竞争格局。
一、NVIDIA的“护城河”:生态系统对硬件的胜利
长期以来,尽管AMD和NVIDIA都生产AI GPU,但AI巨头们却纷纷涌向黄仁勋(Jensen Huang),而忽略了苏姿丰(Lisa Su)。AMD一度在AI竞争中沦为“脚注”,市场份额仅为6%,而NVIDIA的市场份额在2025年第二季度达到了惊人的94%,并且还在持续收紧。
这种巨大的差距,其核心原因并非仅仅是芯片性能,而是NVIDIA在软件领域建立的生态优势——CUDA(统一计算设备架构)。
1. CUDA的先发优势与标准地位
生态基础:CUDA是一个强大的API(应用程序接口),允许用户使用C++或Python等语言编写代码,利用NVIDIA的GPU进行非图形任务的加速。时间窗口:NVIDIA早在2007年就发布了CUDA。由于发布时间早,并在研究领域获得了持续而坚定的支持,CUDA迅速成为了行业默认标准。易用性与普及:CUDA极大地提高了工程师、研究人员和科学家利用GPU加速的便捷性。这使得NVIDIA成为首选的GPU供应商,其生态系统积累已久,难以撼动。
2. 战略远见:押注深度学习
早在ChatGPT等大型语言模型(LLM)出现前数年,NVIDIA就展现了对未来的远见。在2016年的报告中,NVIDIA已明确指出深度学习突破引发了AI革命,并强调其进展和影响将是指数级的。当时,NVIDIA已经开始发布专为AI和深度学习设计的GPU,例如基于Pascal架构的Tesla P100系列。
相比之下,尽管AMD的营收在AI热潮初期(2020年至2022年)大幅增长,但其随后的利润却大幅下滑。研究人员很快意识到,在芯片、架构以及多年的研究积累方面,NVIDIA才是AI领域的更优选择。
二、AMD的硬核突围:MI300X的性能逆袭
面对NVIDIA的垄断,AMD开始了一系列激进的追赶策略,包括在2022年初以490亿美元的股票交易形式收购了制造FPGA(现场可编程门阵列)和自适应计算芯片的赛灵思(Xilinx)。此外,为了弥补软件生态的不足,AMD还收购了开源AI提供商Nod AI。
AMD孤注一掷的决心最终体现在其旗舰产品——MI300X GPU上。
1. 硬件指标与性能优势
MI300X是AMD专为生成式AI工作负载设计的GPU。它结合了CDNA3架构,并搭载了业界领先的192 GB HBM3高带宽内存,提供了5.2 TB/s的内存带宽。
内存与带宽:MI300X的内存带宽达到了5.3 TB/s,比NVIDIA的旗舰H100多出约60%。延迟改善:在AI和LLM任务中,AMD的MI300X相对于NVIDIA有40%的延迟改善。
2. 决定性因素:大型批次下的成本效益
这些硬件优势转化为一个关键的商业优势:更低的成本。对于大规模运算需求的公司而言:
大规模优势:在较高的批量大小(batch size)下,AMD的MI300X具有成本优势,其每Token成本更低。客户价值:对于OpenAI这类需要处理数百万次不间断查询的公司来说,MI300X能够以更低的成本服务更多的用户或更快地训练模型。
尽管MI300系列最初的营收预期(从80亿美元降至50亿美元)令投资者失望,但AMD依然成功获得了微软、戴尔和Meta等客户,将MI300系列用于AI训练。
三、行业转折点:OpenAI与AMD的“黄金客户”之盟
MI300系列的性能优势未能迅速打破NVIDIA的生态壁垒。但市场的变化,特别是NVIDIA的垄断导致的供应短缺和风险,为AMD创造了机会。客户开始感受到市场对单一供应商的过度依赖带来的压力。
1. 深度参与下一代架构设计
真正的转折发生在OpenAI的介入。
在2025年6月的“推进AI”活动中,AMD不仅发布了Instinct MI350系列,还预告了即将推出的MI400和MI450系列。与以往不同的是,OpenAI创始人兼首席执行官Sam Altman出席了AMD的活动,并透露OpenAI对下一代Instinct系列的设计提供了大量反馈,深刻影响了AMD的设计方向。
2. 潜在1000亿美元的战略部署
仅仅几个月后,OpenAI就宣布其下一代AI基础设施将运行在AMD Instinct GPU上,并从2026年下半年推出的MI450系列开始。这笔交易预计将为AMD带来数百亿美元的收入,潜在价值高达1000亿美元。
OpenAI选择AMD,向整个行业发出了一个巨大的信号:市场需要多元化,且AMD的技术潜力已被顶级AI公司认可。
3. 股权激励:绑定成功与共担风险
这项合作最引人注目的条款是其独特的风险共担机制。
AMD向OpenAI授予了多达1.6亿股普通股的认股权证,如果特定的性能和部署里程碑得以实现,OpenAI将可以获得最高达AMD10%的股份稀释。
NVIDIA首席执行官黄仁勋(Jensen Huang)对此表示惊讶,认为在产品尚未建成之前就出让10%的公司股份是“富有想象力、独特且令人吃惊”的。但对于长期处于劣势的AMD来说,这是一次必须采取的孤注一掷的突围策略。
四、深度分析与洞察:生态系统的博弈与挑战
AMD与OpenAI的合作,不仅仅是一笔商业交易,更是对当前AI硬件市场深层矛盾的一次爆发性回应。作为分析师,我认为该事件揭示了三个核心趋势和挑战:
1. 供应链风险与多元化需求驱动市场变革
NVIDIA的市场垄断地位,虽然基于其卓越的技术和生态,但也造成了整个AI产业的瓶颈。当H100和H200等芯片供不应求,客户等待时间过长时,这种过度依赖单一供应商的风险开始显现。OpenAI的行动实质上是为了确保关键基础设施的长期稳定性和议价能力。通过将AMD提升为可行的替代选项,OpenAI不仅获得了定制化的芯片设计,更是在全球芯片短缺的背景下,为自己的未来计算需求设置了一道保险。
2. 硬件性能的胜利能否跨越软件鸿沟?
尽管MI300X在内存带宽和AI推理能力上超越了H100,但AMD的ROCm(Radeon Open Compute)平台与CUDA的差距仍是其最大的弱点。
部署挑战:ROCm虽然是开源的,并具有灵活性,但开发者普遍认为CUDA更容易“开箱即用”,且文档完善度更高。生态惯性:多年来积累的开发者社区和研究习惯,使得许多公司和开发者对转向AMD持犹豫态度,即使硬件具有成本和效率优势。
OpenAI的“10%股权赌注”正是为了迫使并加速AMD解决这一软件生态难题。如果ROCm不能在2026年MI450大规模部署前达到可大规模交付的成熟度,这项合作的风险将是巨大的。
3. “黄金客户”的权力转移
OpenAI对AMD下一代架构的直接设计投入,标志着AI领导者在硬件供应链中的权力正在增强。顶级AI公司不再仅仅是芯片的购买者,它们正在成为硬件定义的共同设计师。通过股权激励,OpenAI将自身利益与AMD的成功深度绑定,从纯粹的客户变成了事实上的战略伙伴和共同投资者。这种模式可能成为未来大型科技公司确保定制化、优化硬件供应的新范例。
五、总结与展望
AMD与OpenAI的百亿交易,无疑是AI芯片竞赛中的一次地震。它不仅使AMD从一个“陪跑者”重新成为AI竞赛的中心,也以市场多元化的需求,对NVIDIA长期以来建立的生态垄断发起了最强烈的挑战。
这场竞赛的核心,已从单纯的硬件性能比拼,转向了软件生态系统和供应链韧性的全面博弈。AMD已经证明了其芯片设计的能力(MI300X的硬件优势),但要真正赢得未来,它必须在软件领域(ROCm)与CUDA之间搭建一座坚实的桥梁。
最终,这场由OpenAI豪赌开启的芯片之战,将决定谁来为下一代人工智能提供动力。我们不得不问:在AI时代的巨大资本和定制化需求的推动下,AMD能否及时弥补与NVIDIA长达十余年的软件生态差距,从而兑现这笔世纪豪赌?
要点摘要
NVIDIA的垄断核心:市场份额达94%,核心竞争力在于2007年发布的CUDA软件生态,而非仅仅是硬件。AMD的硬件反击:MI300X在内存带宽(比H100高约60%)和大规模低成本/Token方面具备显著优势。OpenAI的战略合作:OpenAI深度参与了AMD下一代MI450系列的设计,并选择AMD作为其未来基础设施核心。百亿股权对赌:AMD向OpenAI授予最多10%的普通股认股权证,作为达成特定部署里程碑的激励,这是AMD孤注一掷的突围策略。最大挑战:AMD的ROCm平台在部署和文档完善度上仍弱于CUDA,软件生态的差距是AMD能否成功的关键。
原始视频:https://youtu.be/ZG1yJSm83Jw?si=y5SnU8G3wQE2sZKR
中英文字幕:【AMD与OpenAI的百亿豪赌:AI芯片“挑战者”如何撼动NVIDIA的生态壁垒】