从文字到图像,只需0.5秒!你的电脑终于有了”视觉”
上一篇我们给电脑装上了”大脑”,它能说会道、能写能编。但总觉得缺点什么——对,它看不见!
就像一个有思想的盲人,再机智也无法描绘这个世界。今天,我们就要给这个大脑装上”眼睛”和”画笔”,让它不仅能理解你的语言,还能把你的想象变成肉眼可见的图像。
而且,这一切都在你的电脑本地完成,绝对隐私,完全免费。
一、为什么选择FLUX.2?
如果你关注AI绘图,必定听过Midjourney——那个生成质量天花板,但每月10美元起,还得”爬梯子”。而今天我们要部署的FLUX.2,质量媲美Midjourney,却是开源免费 。
FLUX.2是什么来头?
它的开发团队叫Black Forest Labs(黑森林实验室),成员大多来自Stable Diffusion的原始开发团队 。换句话说,这是Stable Diffusion的原班人马打造的新一代模型。
2026年1月发布的最新版本
FLUX.2 [klein] 是Black Forest Labs刚开源的系列模型,”klein”在德语中意为”小”,主打轻量、快速、高质量 。
有两个版本可选:
1.4B 蒸馏版 | 约8-13GB | 4步生成,0.5-1秒出图,Apache 2.0商用协议 | RTX 3090用户首选|
2.9B 蒸馏版 | 约16-20GB | 质量更高,但非商用协议 | 追求极致质量且不商用 |
根据实测,4B版本在3090上跑得飞起,生成速度约1秒,质量已经惊艳 。而且Apache 2.0协议允许商用,你用它生成的图片可以放心发朋友圈、做视频封面,甚至接单赚钱。
更重大的是,FLUX.2将图像生成与编辑能力统一在同一个模型中——一个模型既能文生图,又能图生图、图像编辑、多参考生成 。这在之前需要多个模型配合才能实现。
二、 安装ComfyUI:图像生成的”工作台”
要运行FLUX.2,我们需要一个强劲的工具——ComfyUI。
ComfyUI是目前最流行的AI绘图工作流工具,用节点式界面让你像搭积木一样组合各种模型和处理步骤 。虽然看起来比网页版复杂,但可玩性极高,而且对显存优化更好。
2.1 下载ComfyUI
方法一:Git克隆(推荐,方便更新)
打开命令行,进入你想安装的目录(列如D盘),执行:git clone
https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
方法二:下载免安装包(省心)
1. 打开ComfyUI的GitHub发布页:[
https://github.com/comfyanonymous/ComfyUI/releases](
https://github.com/comfyanonymous/ComfyUI/releases)
2. 下载 `
ComfyUI_windows_portable_nvidia.7z`
3. 解压到任意目录,列如 `D:ComfyUI`
2.2 首次启动
进入ComfyUI目录,找到 `run_nvidia_gpu.bat`,双击运行。
第一次启动会安装依赖,可能需要几分钟。安装完成后,浏览器会自动打开 `http://127.0.0.1:8188`,你会看到ComfyUI的界面 。
默认是英文,如果想汉化,可以:
1. 关闭ComfyUI窗口
2. 下载中文语言包:`git clone
https://github.com/AIGODLIKE/AIGODLIKE-ComfyUI-Translation.git`
3. 将文件夹复制到 `ComfyUI/custom_nodes/` 目录下
4. 重新启动ComfyUI,在设置里选择中文
三、下载FLUX.2模型:三个核心文件
ComfyUI只是”工作台”,还需要放入”画笔”——也就是模型文件。FLUX.2需要三个核心组件 :
3.1 模型文件结构
最终你的模型目录应该是这样的:
ComfyUI/
├── models/
│ ├── diffusion_models/ ← 主模型
│ │ └── flux-2-klein-4b-fp8.safetensors
│ ├── text_encoders/ ← 文本编码器(理解你的提示词)
│ │ └── qwen_3_4b.safetensors
│ └── vae/ ← VAE解码器(将潜空间转为图像)
│ └── flux2-vae.safetensors
3.2 下载地址(国内镜像)
为了避免无法访问Hugging Face,这里提供国内镜像源:
主模型(Diffusion Model) :
– 文件名:`
flux-2-klein-4b-fp8.safetensors`
– 下载链接:
https://hf-mirror.com/black-forest-labs/FLUX.2-klein-4B-fp8/resolve/main/flux-2-klein-4b-fp8.safetensors
– 存放位置:`
ComfyUI/models/diffusion_models/`
文本编码器(Text Encoder):
– 文件名:`qwen_3_4b.safetensors`
– 下载链接:
https://hf-mirror.com/black-forest-labs/FLUX.2-klein-4B/resolve/main/text_encoder/qwen_3_4b.safetensors
– 存放位置:`
ComfyUI/models/text_encoders/`
VAE模型 :
– 文件名:`flux2-vae.safetensors`
– 下载链接:
https://hf-mirror.com/black-forest-labs/FLUX.2-klein-4B/resolve/main/vae/flux2-vae.safetensors
– 存放位置:`ComfyUI/models/vae/`
注意:如果链接失效或速度慢,可以用百度网盘(关注公众号发送”FLUX.2″获取最新链接),或者用迅雷下载种子文件。
四、首次生成:见证奇迹的时刻
4.1 加载工作流
ComfyUI的灵魂是”工作流”。针对FLUX.2,官方提供了优化好的工作流模板。
1. 下载基础工作流文件:[点击下载](
https://comfy.org/templates/image_flux2_klein_text_to_image/download)
2. 在ComfyUI界面中,点击”Load”按钮,选择下载的json文件
加载后会看到这样的节点图(放截图):
– 左边是”CLIP文本编码器”(输入提示词)
– 中间是”采样器”(核心生成过程)
– 右边是”VAE解码”和”保存图像”
4.2 输入提示词
双击”CLIP文本编码器”节点,在文本框中输入你的提示词。
注意:FLUX.2虽然用了Qwen3的文本编码器,但对中文支持还是不太好,提议用英文提示词 。可以先用翻译软件写好中文,再翻译成英文。
试试这几个提示词(复制粘贴即可):
# 景色类
A breathtaking mountain landscape at sunset, golden light streaming through pine trees, snow-capped peaks in distance, ultra detailed, photorealistic, 8k
# 人像类
Portrait of a young woman with freckles, soft morning light, bokeh background, professional photography, intricate details, cinematic
# 科幻类
Cyberpunk city street at night, neon lights reflecting in puddles, flying cars, rain, holographic advertisements, futuristic, blade runner style
# 二次元
Anime style illustration of a magical girl, vibrant colors, flowing hair, sparkles, fantasy background, trending on pixiv
4.3 点击生成
设置好提示词后,点击右侧的”Queue Prompt”按钮(或按Ctrl+Enter),就会开始生成。
首次生成需要加载模型到显存,第一次可能会慢一点(约10-20秒),之后每次生成只需1-2秒 。
4.4 看效果
来看几张我用3090生成的样图(放多张图片对比):
【景色类】
提示词:*”A beautiful mountain lake at sunrise, mist rising from water, reflection of peaks, photorealistic”*
生成效果:光影自然,细节丰富,完全可以当壁纸
【人像类】
提示词:*”Close-up portrait of an elderly fisherman, weathered face, deep wrinkles, intense eyes, dramatic lighting”*
生成效果:皮肤质感真实,眼神有故事
【二次元】
提示词:*”Anime girl with cat ears, pastel colors, cherry blossoms, soft style, trending on pixiv”*
生成效果:符合日系审美,线条干净
【创意类】
提示词:*”A steampunk elephant made of brass and gears, intricate mechanical details, fantasy, concept art”*
生成效果:想象力丰富,结构合理
这就是你电脑生成的!*不用联网,不花一分钱,想生成多少就生成多少。
五、参数详解:从入门到精通
生成的图片不满意?别急,调整几个参数就能大幅提升效果。根据实测经验,这些参数最关键 :
5.1 步数(Steps)
步数决定细节程度:
– 4步:FLUX.2蒸馏版的推荐值,速度最快,质量已经很好
– 8-12步:细节更丰富,特别适合复杂构图
– 20步以上:提升有限,但时间翻倍,不推荐
实测经验:简单场景(单人站立)4步足够;复杂场景(双人互动、复杂姿势)提议8-12步 。
5.2 CFG引导尺度
CFG决定提示词的遵循程度:
– CFG 1.0:完全依赖模型”想象力”,可能偏离提示词
– CFG 1.2-1.5:甜点区间,既遵循提示词,又保持自然
– CFG > 2.0:色彩过饱和,可能出现 artifacts
特别注意:FLUX.2的CFG行为与传统模型不同,超过2.0反而容易出错。提议从1.2开始微调 。
5.3 采样器(Sampler)
采样器影响生成质量和风格:
①Euler| 默认选项,平衡速度与质量 | 大多数场景 |
②DPM++ 2M | 细节更丰富,稍慢 | 追求极致细节 |
③res 2s | 每步计算两次,能改善解剖结构 | 人像、复杂姿势 |
技巧:遇到手部变形、多只脚等”解剖恐怖”,可以试试换用 `res 2s` 采样器,步数保持4-6即可 。
5.4 分辨率
在3090 24GB显存下,推荐分辨率:
| 显存占用 | 推荐分辨率 | 说明 |
| ~8GB | 1024×1024 | 4B模型,速度最快 |
| ~12GB | 1280×720 | 宽屏壁纸比例 |
| ~16GB | 1536×640 | 超宽屏,适合海报 |
| ~20GB | 1920×1080 | 全高清,但生成稍慢 |
实测:我常用1280×720,兼顾速度和画质。
5.5 参数组合提议
根据我的数百次测试,这几组组合最稳 :
| 场景 | 步数 | CFG | 采样器 | 分辨率 |
| 快速试错 | 4 | 1.2 | Euler | 1024×1024 |
| 标准人像 | 8 | 1.3 | DPM++ 2M | 1280×720 |
| 复杂构图 | 12 | 1.5 | res 2s | 1280×720 |
| 壁纸级 | 16 | 1.2 | DPM++ 2M | 1536×864 |
六、常见问题与解决方案
6.1 生成的人有五根手指吗?
这是AI绘图的经典问题。FLUX.2已经改善许多,但偶尔还会翻车 。
解决方案:
– 步数提高到8-12
– CFG调到1.3-1.5
– 尝试 `res 2s` 采样器
– 在提示词中加入 `perfect hands, five fingers`
6.2 显存不足怎么办?
如果你发现跑不起来,试试:
1. 关闭其他程序(尤其是Chrome浏览器)
2. 降低分辨率到768×768
3. 使用FP8量化版本(我们下载的就是)
4. 在ComfyUI设置中开启”低显存模式”
6.3 生成太慢?
正常速度应该在1-3秒/张。如果慢:
1. 检查是否用了正确的GPU(任务管理器→性能→GPU)
2. 步数降到4
3. 分辨率降到1024×1024以下
4. 重启ComfyUI
6.4 中文提示词乱码?
FLUX.2用了Qwen3的文本编码器,但对中文支持还是不够好 。提议用英文提示词,或者先用翻译软件转成英文。
七、进阶预告:如何用OpenClaw调用ComfyUI
目前你的电脑已经能”说”能”画”了。但有没有想过,让它们协作起来?
下一篇【整合篇】,我们将教你用OpenClaw统一调度所有模型:
> “写一个关于森林的故事,生成一张配图,再生成一段5秒的森林视频。”
——说完这句话,OpenClaw会自动调用Qwen3写故事,调用FLUX.2画配图,再调用通义万相生成视频。全程自动化,你的数据从未离开电脑。
目前已经有一个 ComfyUI-OpenClaw插件在开发中,专门用于打通OpenClaw和ComfyUI 。等我们下一篇详细讲解。
写在最后:你也能生成这样的壁纸
还记得文章开头的那些样图吗?它们全部来自RTX 3090+FLUX.2的本地生成。
从今天起,你的电脑不仅会思考,还会”画画”。无论你是想做自媒体配图、设计海报、生成头像,还是给孩子画绘本,全都免费、无限量、无审查。
这就是本地AI的魅力:一次投入,无限创作。
下一篇预告:《动起来!本地视频生成实战(通义万相)》——让静态画面变成动态视频,你的AI从此有了”生命力”
互动时间:
你生成了第一张图吗?是什么内容?
关注我,不错过每一篇干货!


