巨头下场,Stable Diffusion、Midjourney们还好吗?

全能 AI 聚合平台 免费

一站式接入主流 AI 大模型,支持对话 · 生图 · 生视频,即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama
AI对话 AI生图 AI视频
免费使用 →

今年3月,一个做商业插画的朋友跟我吐槽:

“以前客户问我'能不能用AI出图',目前客户直接拿谷歌生成的图让我'改改再用'。我花每月60刀买的Midjourney会员,突然好像没那么值了。”

这个感受很真实,也很普遍。

过去两年,AI图像生成赛道经历了疯狂的”造神运动”——Stable Diffusion横空出世、Midjourney封神、无数人靠AI绘画接单赚钱。但2026年走到今天,局面正在发生一个本质性的变化:

科技巨头把图像生成做成了”不要钱的基础设施”,原来靠”卖工具”活着的玩家,突然发现自己的核心壁垒在消失。

这篇文章,我想认真聊聊:巨头下场之后,Stable Diffusion、Midjourney们的处境到底有多危险?对你的工作又意味着什么?


一、发生了什么:巨头杀进来了,而且来势汹汹

先把时间线拉清楚。

2026年,图像生成领域的格局发生了三次标志性事件:

① OpenAI发布GPT-Image-2(2026年4月)

这是目前最重磅的一击。GPT-Image-2不是DALL-E的升级版,而是架构层面的彻底重构——从扩散模型(diffusion)转向自回归架构(autoregressive),Sam Altman自己说这相当于”从GPT-3一步跳到GPT-5″的跨越。

关键数据:

  • 文字渲染准确率:~99%(之前AI生成图像最大的槽点就是文字乱码)
  • 生成速度:~3秒(上一代要8-18秒)
  • 最大分辨率:3840px
  • 成本:最低$0.006/张

同天OpenAI宣布:DALL-E 2和3将在2026年5月12日正式关停。这相当于主动把自己的上一代产品”杀死”——足够说明他们对GPT-Image-2的信心。

② Google全面整合图像生成进Gemini(2026年2月-5月)

Google在2026年IO大会上发布的Nano Banana 2(没错这名字很蠢但产品很强),核心策略是把图像生成塞进每一个谷歌产品里。不是”你专门去用一个图像生成工具”,而是”你在Gmail里写邮件,顺手就能生成配图”。

谷歌的杀手锏是:8亿Gemini用户,图像生成是免费的附加功能。

③ Adobe Firefly推出无限量生成(2026年初)

Adobe的动作更狠——Firefly直接整合进Photoshop、 Illustrator,而且宣布商业授权无限量生成。对设计师来说,这意味着以前要开Midjourney会员才能做的事,目前在PS里点一下就能搞定,还不用担心版权问题。


二、为什么重大:原来的护城河,正在一条条消失

要理解为什么这对Midjourney和Stable Diffusion是致命冲击,得先搞清楚它们原来靠什么赢的。

Midjourney的护城河是什么?

一句话:画质好 + 上手简单

在2023-2024年,Midjourney出图的美学质量的确 碾压大多数竞品,而且用户只需要会打字就能用,不需要懂模型、不懂部署。这也让它积累了约3亿美元的年收入和41.7%的AI绘画市场份额(2026年Q1数据)。

但这个护城河有两个致命弱点:

第一,画质优势正在被抹平。GPT-Image-2在LM Arena文生图榜单上Elo分数1512,Midjourney V7只有约1270,差距高达242分——这个分差被形容为”GPT-4o当年在NLP榜单上的领先优势也没有这么悬殊”。

第二,价格壁垒在巨头的免费策略面前不堪一击。Midjourney会员每月60-120美元,而谷歌和OpenAI的图像生成对普通用户基本是免费的(包含在Gemini/ChatGPT订阅里,不单独收费)。

Stable Diffusion的护城河是什么?

开源、免费、可本地部署、可定制。

但问题也恰恰在这里——开源意味着Stability AI公司本身很难赚钱。2023年Stability AI收入约4420万美元,支出却高达9600万美元,亏损超过5000万美元。2024年CEO离职、核心团队出走、甚至传出了拖欠AWS账单的消息。

更残酷的是:Stable Diffusion的技术优势也在被抹平。以前SD的最大价值是”免费可商用”,但目前谷歌、OpenAI的生成质量更高,而且商业授权更清晰(Adobe Firefly明确承诺版权免责,GPT-Image-2生成的图像OpenAI也给商业授权)。


三、对普通职场人意味着什么:机会还在,但玩法变了

聊到这儿,你可能会想:这跟我有什么关系?我又不是做AI绘画的。

但实则关系很大,而且是对你有利的那种大。

① 做内容、做运营的人:图像生成成本正在趋近于零

以前你想做一张配图,要么自己画(贵、慢),要么找设计师(沟通成本高),要么开Midjourney会员(每月几十刀)。目前呢?打开ChatGPT或者Gemini,打字就能出图,质量还比以前好。

对运营来说,这意味着内容产出的天花板被打开了——以前一周做3篇推文,目前可以做10篇,由于配图不再是大瓶颈。

② 做产品、做销售的人:客户的预期在变

如果你的产品/服务涉及到”视觉内容生成”这个卖点,需要知道:客户对”AI生成图像”的预期正变得超级高。以前客户觉得”AI能出图就很神奇”,目前客户会拿GPT-Image-2的标准来要求你——文字渲染准不准?分辨率够不够高?能不能批量生成?

③ 所谓”AI绘画副业”:红利期的确 在收窄

2026年的一项调研显示,60%做AI绘画副业的人月收入不到800元。缘由很简单——会用AI出图的人太多了,而且门槛还在持续降低。以前你会Midjourney就能接单,目前你的客户自己也会用ChatGPT出图了。

但这不意味着机会消失了,而是机会从”会用工具”转移到了”会用工具解决问题”。能帮企业把AI图像生成融入实际工作流的运营/产品人,价值反而更大了。


四、我的判断:这一轮洗牌之后,活下来的会是谁?

说几个我自己的判断,不必定对,但逻辑是这样:

Midjourney不会死,但会从”必需品”变成”进阶工具”。

Midjourney在美学风格控制上还是有独特优势的,对专业设计师/插画师来说,它依旧有存在价值。但它很难再维持目前这种”全民都在用”的状态了——谷歌和OpenAI会把图像生成变成每个人都能用的基础能力,就像今天的翻译功能一样。

Stable Diffusion会以另一种方式活下来:作为底层技术,而不是消费级产品。

开源模型的命运往往如此——它不会消失,但会以”基础设施”的形式存在,被大厂集成进自己的产品里,而不是直接面向普通用户。

最大的赢家,是那些把图像生成”藏”进工作流的平台。

谷歌、Adobe、OpenAI的共同策略是:不让用户”专门去用图像生成”,而是让图像生成出目前用户本来就有的工作流里。这才是真正的护城河——不是技术本身,而是”用户在哪,我就在哪”。


结尾

回头看AI图像生成这两年,有点像打车大战、外卖大战的翻版——先烧钱造市场,再巨头进场清场,最后剩下两三个大玩家+一些垂直场景的专业工具。

对普通职场人来说,这实则是个好消息:你不需要懂技术,不需要会部署模型,甚至不需要单独付费,就能用上世界上最强的图像生成能力。

工具越来越多、越来越强、越来越便宜,这才是AI应该有的样子。

© 版权声明

相关文章

1 条评论

none
暂无评论...