画龙点睛——让AI画出你的想象力(FLUX.2部署)

内容分享3小时前发布
0 1 0
全能 AI 聚合平台 免费

一站式接入主流 AI 大模型,支持对话 · 生图 · 生视频,即开即用

ChatGPT Claude Gemini Grok DeepSeek 通义千问 Ollama
AI对话 AI生图 AI视频
免费使用 →

从文字到图像,只需0.5秒!你的电脑终于有了”视觉”

上一篇我们给电脑装上了”大脑”,它能说会道、能写能编。但总觉得缺点什么——对,它看不见!

就像一个有思想的盲人,再机智也无法描绘这个世界。今天,我们就要给这个大脑装上”眼睛”和”画笔”,让它不仅能理解你的语言,还能把你的想象变成肉眼可见的图像。

而且,这一切都在你的电脑本地完成,绝对隐私,完全免费。

一、为什么选择FLUX.2?

如果你关注AI绘图,必定听过Midjourney——那个生成质量天花板,但每月10美元起,还得”爬梯子”。而今天我们要部署的FLUX.2,质量媲美Midjourney,却是开源免费 。

FLUX.2是什么来头?

它的开发团队叫Black Forest Labs(黑森林实验室),成员大多来自Stable Diffusion的原始开发团队 。换句话说,这是Stable Diffusion的原班人马打造的新一代模型。

2026年1月发布的最新版本

FLUX.2 [klein] 是Black Forest Labs刚开源的系列模型,”klein”在德语中意为”小”,主打轻量、快速、高质量 。

有两个版本可选:

1.4B 蒸馏版 | 约8-13GB | 4步生成,0.5-1秒出图,Apache 2.0商用协议 | RTX 3090用户首选|

2.9B 蒸馏版 | 约16-20GB | 质量更高,但非商用协议 | 追求极致质量且不商用 |

根据实测,4B版本在3090上跑得飞起,生成速度约1秒,质量已经惊艳 。而且Apache 2.0协议允许商用,你用它生成的图片可以放心发朋友圈、做视频封面,甚至接单赚钱。

更重大的是,FLUX.2将图像生成与编辑能力统一在同一个模型中——一个模型既能文生图,又能图生图、图像编辑、多参考生成 。这在之前需要多个模型配合才能实现。

二、 安装ComfyUI:图像生成的”工作台”

要运行FLUX.2,我们需要一个强劲的工具——ComfyUI。

ComfyUI是目前最流行的AI绘图工作流工具,用节点式界面让你像搭积木一样组合各种模型和处理步骤 。虽然看起来比网页版复杂,但可玩性极高,而且对显存优化更好。

2.1 下载ComfyUI

方法一:Git克隆(推荐,方便更新)

打开命令行,进入你想安装的目录(列如D盘),执行:git clone
https://github.com/comfyanonymous/ComfyUI.git

cd ComfyUI

方法二:下载免安装包(省心)

1. 打开ComfyUI的GitHub发布页:[
https://github.com/comfyanonymous/ComfyUI/releases](
https://github.com/comfyanonymous/ComfyUI/releases)

2. 下载 `
ComfyUI_windows_portable_nvidia.7z`

3. 解压到任意目录,列如 `D:ComfyUI`

2.2 首次启动

进入ComfyUI目录,找到 `run_nvidia_gpu.bat`,双击运行。

第一次启动会安装依赖,可能需要几分钟。安装完成后,浏览器会自动打开 `http://127.0.0.1:8188`,你会看到ComfyUI的界面 。

默认是英文,如果想汉化,可以:

1. 关闭ComfyUI窗口

2. 下载中文语言包:`git clone
https://github.com/AIGODLIKE/AIGODLIKE-ComfyUI-Translation.git`

3. 将文件夹复制到 `ComfyUI/custom_nodes/` 目录下

4. 重新启动ComfyUI,在设置里选择中文

三、下载FLUX.2模型:三个核心文件

ComfyUI只是”工作台”,还需要放入”画笔”——也就是模型文件。FLUX.2需要三个核心组件 :

3.1 模型文件结构

最终你的模型目录应该是这样的:

ComfyUI/

├── models/

│ ├── diffusion_models/ ← 主模型

│ │ └── flux-2-klein-4b-fp8.safetensors

│ ├── text_encoders/ ← 文本编码器(理解你的提示词)

│ │ └── qwen_3_4b.safetensors

│ └── vae/ ← VAE解码器(将潜空间转为图像)

│ └── flux2-vae.safetensors

3.2 下载地址(国内镜像)

为了避免无法访问Hugging Face,这里提供国内镜像源:

主模型(Diffusion Model) :

– 文件名:`
flux-2-klein-4b-fp8.safetensors`

– 下载链接:
https://hf-mirror.com/black-forest-labs/FLUX.2-klein-4B-fp8/resolve/main/flux-2-klein-4b-fp8.safetensors

– 存放位置:`
ComfyUI/models/diffusion_models/`

文本编码器(Text Encoder):

– 文件名:`qwen_3_4b.safetensors`

– 下载链接:
https://hf-mirror.com/black-forest-labs/FLUX.2-klein-4B/resolve/main/text_encoder/qwen_3_4b.safetensors

– 存放位置:`
ComfyUI/models/text_encoders/`

VAE模型 :

– 文件名:`flux2-vae.safetensors`

– 下载链接:
https://hf-mirror.com/black-forest-labs/FLUX.2-klein-4B/resolve/main/vae/flux2-vae.safetensors

– 存放位置:`ComfyUI/models/vae/`

注意:如果链接失效或速度慢,可以用百度网盘(关注公众号发送”FLUX.2″获取最新链接),或者用迅雷下载种子文件。

四、首次生成:见证奇迹的时刻

4.1 加载工作流

ComfyUI的灵魂是”工作流”。针对FLUX.2,官方提供了优化好的工作流模板。

1. 下载基础工作流文件:[点击下载](
https://comfy.org/templates/image_flux2_klein_text_to_image/download)

2. 在ComfyUI界面中,点击”Load”按钮,选择下载的json文件

加载后会看到这样的节点图(放截图):

– 左边是”CLIP文本编码器”(输入提示词)

– 中间是”采样器”(核心生成过程)

– 右边是”VAE解码”和”保存图像”

4.2 输入提示词

双击”CLIP文本编码器”节点,在文本框中输入你的提示词。

注意:FLUX.2虽然用了Qwen3的文本编码器,但对中文支持还是不太好,提议用英文提示词 。可以先用翻译软件写好中文,再翻译成英文。

试试这几个提示词(复制粘贴即可):

# 景色类

A breathtaking mountain landscape at sunset, golden light streaming through pine trees, snow-capped peaks in distance, ultra detailed, photorealistic, 8k

# 人像类

Portrait of a young woman with freckles, soft morning light, bokeh background, professional photography, intricate details, cinematic

# 科幻类

Cyberpunk city street at night, neon lights reflecting in puddles, flying cars, rain, holographic advertisements, futuristic, blade runner style

# 二次元

Anime style illustration of a magical girl, vibrant colors, flowing hair, sparkles, fantasy background, trending on pixiv

4.3 点击生成

设置好提示词后,点击右侧的”Queue Prompt”按钮(或按Ctrl+Enter),就会开始生成。

首次生成需要加载模型到显存,第一次可能会慢一点(约10-20秒),之后每次生成只需1-2秒 。

4.4 看效果

来看几张我用3090生成的样图(放多张图片对比):

【景色类】

提示词:*”A beautiful mountain lake at sunrise, mist rising from water, reflection of peaks, photorealistic”*

生成效果:光影自然,细节丰富,完全可以当壁纸

【人像类】

提示词:*”Close-up portrait of an elderly fisherman, weathered face, deep wrinkles, intense eyes, dramatic lighting”*

生成效果:皮肤质感真实,眼神有故事

【二次元】

提示词:*”Anime girl with cat ears, pastel colors, cherry blossoms, soft style, trending on pixiv”*

生成效果:符合日系审美,线条干净

【创意类】

提示词:*”A steampunk elephant made of brass and gears, intricate mechanical details, fantasy, concept art”*

生成效果:想象力丰富,结构合理

这就是你电脑生成的!*不用联网,不花一分钱,想生成多少就生成多少。

五、参数详解:从入门到精通

生成的图片不满意?别急,调整几个参数就能大幅提升效果。根据实测经验,这些参数最关键 :

5.1 步数(Steps)

步数决定细节程度:

– 4步:FLUX.2蒸馏版的推荐值,速度最快,质量已经很好

– 8-12步:细节更丰富,特别适合复杂构图

– 20步以上:提升有限,但时间翻倍,不推荐

实测经验:简单场景(单人站立)4步足够;复杂场景(双人互动、复杂姿势)提议8-12步 。

5.2 CFG引导尺度

CFG决定提示词的遵循程度:

– CFG 1.0:完全依赖模型”想象力”,可能偏离提示词

– CFG 1.2-1.5:甜点区间,既遵循提示词,又保持自然

– CFG > 2.0:色彩过饱和,可能出现 artifacts

特别注意:FLUX.2的CFG行为与传统模型不同,超过2.0反而容易出错。提议从1.2开始微调 。

5.3 采样器(Sampler)

采样器影响生成质量和风格:

①Euler| 默认选项,平衡速度与质量 | 大多数场景 |

②DPM++ 2M | 细节更丰富,稍慢 | 追求极致细节 |

③res 2s | 每步计算两次,能改善解剖结构 | 人像、复杂姿势 |

技巧:遇到手部变形、多只脚等”解剖恐怖”,可以试试换用 `res 2s` 采样器,步数保持4-6即可 。

5.4 分辨率

在3090 24GB显存下,推荐分辨率:

| 显存占用 | 推荐分辨率 | 说明 |

| ~8GB | 1024×1024 | 4B模型,速度最快 |

| ~12GB | 1280×720 | 宽屏壁纸比例 |

| ~16GB | 1536×640 | 超宽屏,适合海报 |

| ~20GB | 1920×1080 | 全高清,但生成稍慢 |

实测:我常用1280×720,兼顾速度和画质。

5.5 参数组合提议

根据我的数百次测试,这几组组合最稳 :

| 场景 | 步数 | CFG | 采样器 | 分辨率 |

| 快速试错 | 4 | 1.2 | Euler | 1024×1024 |

| 标准人像 | 8 | 1.3 | DPM++ 2M | 1280×720 |

| 复杂构图 | 12 | 1.5 | res 2s | 1280×720 |

| 壁纸级 | 16 | 1.2 | DPM++ 2M | 1536×864 |

六、常见问题与解决方案

6.1 生成的人有五根手指吗?

这是AI绘图的经典问题。FLUX.2已经改善许多,但偶尔还会翻车 。

解决方案:

– 步数提高到8-12

– CFG调到1.3-1.5

– 尝试 `res 2s` 采样器

– 在提示词中加入 `perfect hands, five fingers`

6.2 显存不足怎么办?

如果你发现跑不起来,试试:

1. 关闭其他程序(尤其是Chrome浏览器)

2. 降低分辨率到768×768

3. 使用FP8量化版本(我们下载的就是)

4. 在ComfyUI设置中开启”低显存模式”

6.3 生成太慢?

正常速度应该在1-3秒/张。如果慢:

1. 检查是否用了正确的GPU(任务管理器→性能→GPU)

2. 步数降到4

3. 分辨率降到1024×1024以下

4. 重启ComfyUI

6.4 中文提示词乱码?

FLUX.2用了Qwen3的文本编码器,但对中文支持还是不够好 。提议用英文提示词,或者先用翻译软件转成英文。

七、进阶预告:如何用OpenClaw调用ComfyUI

目前你的电脑已经能”说”能”画”了。但有没有想过,让它们协作起来?

下一篇【整合篇】,我们将教你用OpenClaw统一调度所有模型:

> “写一个关于森林的故事,生成一张配图,再生成一段5秒的森林视频。”

——说完这句话,OpenClaw会自动调用Qwen3写故事,调用FLUX.2画配图,再调用通义万相生成视频。全程自动化,你的数据从未离开电脑。

目前已经有一个 ComfyUI-OpenClaw插件在开发中,专门用于打通OpenClaw和ComfyUI 。等我们下一篇详细讲解。

写在最后:你也能生成这样的壁纸

还记得文章开头的那些样图吗?它们全部来自RTX 3090+FLUX.2的本地生成。

从今天起,你的电脑不仅会思考,还会”画画”。无论你是想做自媒体配图、设计海报、生成头像,还是给孩子画绘本,全都免费、无限量、无审查。

这就是本地AI的魅力:一次投入,无限创作。

下一篇预告:《动起来!本地视频生成实战(通义万相)》——让静态画面变成动态视频,你的AI从此有了”生命力”

互动时间:

你生成了第一张图吗?是什么内容?

关注我,不错过每一篇干货!

© 版权声明

相关文章

1 条评论

none
暂无评论...