大模型正在改变Coding领域,在做图片、做视频领域也大有可为,周末在探索ComfyUI的使用过程。
ComfyUI 使用指南
节点式 Stable Diffusion 可视化工作流引擎,支持高精度、可复用、可扩展的 AI 图像/视频生成
目录
- 简介
- 安装(3 种方式)
- 界面与基础操作
- 模型与文件结构
- 核心功能
- 标准工作流:文生图
- 常用扩展与插件
- 快捷键与优化技巧
- 常见问题
1. 简介
ComfyUI 是一款基于节点可视化的 Stable Diffusion 界面,主打:
- 极低显存占用
- 工作流可保存、可导入导出
- 高精度控制每一步生成逻辑
- 支持 ControlNet、LoRA、Hypernetwork、VAE、AnimateDiff、视频生成等
- 全平台:Windows / macOS / Linux
适用人群:进阶画师、设计师、AI 工作流开发者。
2. 安装(3 种方案)
2.1 桌面版(推荐新手)
- 下载官方桌面安装包
- 运行安装,选择非系统盘路径(提议 SSD,≥20GB 空间)
- 自动配置 Python 与环境
- 双击快捷方式启动
- 浏览器自动打开:http://127.0.0.1:8188
2.2 便携版(Windows 免安装)
- 下载 ComfyUI_windows_portable
- 解压到英文路径
- 根据显卡运行对应启动脚本: NVIDIA:run_nvidia_gpu.bat AMD:run_amd_gpu.bat CPU:run_cpu.bat
2.3 手动源码安装(进阶)
git clone https://github.com/comfyanonymous/ComfyUI.git
cd ComfyUI
# 创建虚拟环境
python -m venv venv
venvScriptsactivate # Windows
# source venv/bin/activate # Linux/macOS
# 安装依赖
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install -r requirements.txt
# 启动
python main.py
3. 界面与基础操作
3.1 界面布局
- 左侧面板:节点库(双击画布可搜索)
- 中央画布:节点编辑区
- 右侧/底部:队列、日志、预览、设置
- 顶部菜单:保存/加载工作流、队列、清除、管理器
3.2 基础操作
- 新增节点:双击画布 → 输入关键词
- 移动:左键拖动节点
- 缩放:鼠标滚轮
- 连线:端口拖到另一端口(颜色匹配才能连)
- 删除:选中节点按 Delete
- 框选:按住左键拖动
- 复制:Ctrl+C / Ctrl+V
- 折叠节点:Ctrl+点击节点标题
4. 模型与文件结构
4.1 核心模型目录
ComfyUI/
└── models/
├── checkpoints/ # 主模型 .ckpt/.safetensors
├── vae/ # VAE 模型
├── lora/ # LoRA
├── controlnet/ # ControlNet 模型
├── embeddings/ # 嵌入文本
└── upscale/ # 放大模型
4.2 其他目录
- input/:输入图片
- output/:生成图片
- custom_nodes/:第三方节点
- user/:工作流保存
5. 核心功能
5.1 基础生成
- 文生图
- 图生图
- 局部重绘(Inpaint)
- 图像放大(Upscale)
- 扩图(Outpaint)
5.2 高级控制
- ControlNet:边缘、姿态、深度、线稿、遮罩精准控制
- LoRA 叠加:支持多 LoRA 混合
- 采样精细调节:步数、CFG、采样器、调度器、噪声
- 区域条件控制:不同区域用不同提示词
- 批处理生成
5.3 工作流能力
- 保存/加载 JSON 工作流
- 从图片还原工作流(PNG info)
- 分支/并行流程
- 模块化复用
- API 调用(自动化/对接程序)
5.4 视频与动画
- AnimateDiff
- 视频生成节点
- 帧序列处理
6. 标准工作流:文生图(必看)
6.1 最小必备节点
- Load Checkpoint:加载主模型
- CLIP Text Encode 两个:正向/负向提示词
- Empty Latent Image:设置尺寸
- KSampler:采样核心
- VAEDecode:潜图转图像
- Save Image / Preview Image:输出
6.2 连接顺序
- Checkpoint → MODEL 给 KSampler
- Checkpoint → CLIP 给两个 CLIP Text Encode
- Checkpoint → VAE 给 VAEDecode
- 正负提示词 → KSampler
- Empty Latent → KSampler
- KSampler → VAEDecode
- VAEDecode → Save Image
6.3 常用参数
- Steps:20–35
- CFG Scale:5–10
- Sampler:dpmpp_2m
- Scheduler:karras
- Denoise:1.0(文生图)
7. 常用扩展(Custom Nodes)
7.1 必装管理器
ComfyUI Manager(一键安装/更新节点)
cd custom_nodes
git clone https://github.com/ltdrdata/ComfyUI-Manager.git
7.2 高频推荐节点
- ControlNet 全套
- Impact Pack:蒙版、选区、细节增强
- Ultimate SD Upscale:高清放大
- Inpaint Advantage:重绘增强
- IP-Adapter:参考图风格迁移
- AnimateDiff:动画视频
8. 快捷键与优化
8.1 快捷键
- Ctrl+Enter:队列生成
- Ctrl+Z:撤销
- Ctrl+S:保存工作流
- Ctrl+L:加载工作流
- Space+拖动:画布平移
- Alt+拖动:快速复制节点
8.2 显存优化
- 使用 FP16 模型
- 开启 –highvram / –normalvram
- 关闭浏览器硬件加速
- 模型放 SSD
- 用更小分辨率起步
9. 常见问题
9.1 Mac使用的一些坑
最新版本只支持Apple芯片,Intel芯片只能用源码安装。用源码安装时,最好用虚拟环境来装,可以思考使用MiniConda。
9.2 导入模型
使用一些模型时,需要下载模型。除了HuggingFace(需要科学上网)。可以思考从ModelScope、LiblibArt中进行下载。
我使用时从ModelScope中进行下载,发现许多模型由于过大,下载下来是一个分层模型,可以使用如下脚本进行合并:
import os
import json
from safetensors.torch import load_file, save_file
def merge_safetensors_shards(model_dir, output_path):
# 读取索引文件
index_path = os.path.join(model_dir, "model.safetensors.index.json")
if not os.path.exists(index_path):
raise FileNotFoundError("找不到索引文件")
with open(index_path, "r") as f:
index_data = json.load(f)
# 收集所有张量
all_tensors = {}
# 获取分片文件
shard_files = sorted([f for f in os.listdir(model_dir) if f.endswith('.safetensors') and 'of' in f])
for shard in shard_files:
shard_path = os.path.join(model_dir, shard)
tensors = load_file(shard_path)
all_tensors.update(tensors)
# 保存为单文件
save_file(all_tensors, output_path)
print(f"合并完成,保存到: {output_path}")
# 用法示例
model_dir = "" # 填写你的分片目录
output_path = "" # 填写保存路径
merge_safetensors_shards(model_dir, output_path)
10. 常见问题
10.1 启动失败
- 路径不要有中文/空格
- 更新显卡驱动
- 安装 VC++ Redistributable
10.2 模型不显示
- 放入正确目录
- 重启 ComfyUI
- 检查文件后缀:.safetensors 优先
10.3 显存不足
- 降低图尺寸
- 关闭其他程序
- 使用 CPU 模式或更小模型
10.4 连线失败
- 端口颜色/类型必须匹配
- 检查节点版本是否兼容 ## 使用感想
- 随着模型的逐渐强劲,做视频也越来越简单。一秒几十万的视频,大模型几分钟就能生成出来。
- 本地使用开源模型,更省钱,但是也一言难尽。模型很大、算力有限。如果常常使用,并且追求效率,直接用可灵、即梦这些是更优的选择。
结束语
ComfyUI 是目前最灵活、最专业的 Stable Diffusion 可视化工作流工具。熟练后可实现任何复杂生成逻辑。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...



