【AI学习-comfyUI学习-文生图-各个部分学习-第一步】
1,前言2,说明1,comfyUI介绍2,running hub
3,流程(1)进入网址,注册登录(2)调用模块1)空白模板2)列表查找3)左键双击
(3)连线(4)输出 提示词1-正面提示词2-负面提示词(5)生成图片
4,模块介绍🧩 1. **Checkpoint加载器(简易)**🟩 2. **CLIP文本编码器(正向提示)**🟥 3. **CLIP文本编码器(负向提示)**🔳 4. **空Latent**⚙️ 5. **K采样器(KSampler)**🧩 6. **VAE解码(VAE Decode)**🖼️ 7. **预览图像**💾 8. **保存图像(Save Image)**🧠 总体流程总结
5,细节部分6,使用的工作流7,总结
1,前言
最近,学习comfyUI,这也是AI的一部分,想将相关学习到的东西尽可能记录下来。
2,说明
1,comfyUI介绍
ComfyUI的好处,就像搭积木一样,可以方便快速调用模型(Node(节点)),生成自己想要的的图片,甚至图片。
(1)既然是积木,有些模块就能组装在一起,有些就是不行的,我们可能先要熟悉模型,知道积木的性质和特点。
(2)之后要知道如何连接,谁和谁可以连接,怎么样连接,连接和后如何做。
(3)一个搭好的积木,我们就可以使用了,就像已经组装好的锤子,下次我们直接使用就行了,当然在这里我们叫它“Workflow(工作流)”
ComfyUI 是一个非常强大的 可视化 AI 工作流管理工具,主要用于图像生成(尤其是基于 Stable Diffusion、FLUX、SDXL 等模型)以及图像编辑、视频生成、合成数据制作等。它用「节点(Node)」的方式把复杂的模型推理过程可视化,就像搭积木一样,你可以自由地组合模型、提示词、采样器、后处理模块等,实现几乎任意的 AI 生成流程。
| 名称 | 说明 |
|---|---|
| Node(节点) | 每个节点代表一个功能模块,例如加载模型、输入图片、加噪、采样、输出结果等。 |
| Workflow(工作流) | 多个节点按照数据流连接起来,就形成一个完整的生成流程。工作流可以保存为 文件。 |
| Prompt(提示词) | 用于控制生成内容的文字描述,支持正向提示词(positive)和反向提示词(negative)。 |
| LoRA / Checkpoint / VAE | 加载不同的权重模型以改变风格或生成领域。 |
| ControlNet / T2I-Adapter | 用于根据输入图像(例如姿态、线稿、深度图)来控制生成结果。 |
2,running hub
因为自己没有高级的电脑,所以使用网络的服务器,网上有很多的,我这里选用了RunningHub,当有自己喜好的或者自己硬件设备更充足的,自己电脑也可的,但是配置方面可能会很蛮烦的。
所以使用网络的其实省去配置过程,算是好处,但是坏处是也是要花钱的,像租赁费的感觉。
连接:https://www.runninghub.ai/

3,流程
(1)进入网址,注册登录
登录上述网址。连接:https://www.runninghub.ai/
然后点击开始创作,不过之前可能确实要先冲一些钱。

如下图,新建工作流,因为首次进入,可能是空白,我这里是已经有了直接用。

(2)调用模块
1)空白模板

首次进入可能是这样的空白模板,所以我们可以通过两种方式来调用模块(Node节点)。
2)列表查找
如下图,在左边,可以点书的图标,就可以调出搜索栏和各个模块,不过对新手而言,开始可能不知道自己需要模块在哪里,需要搜索。

3)左键双击
在这其中,空白模板里,直接点击空白部分,就能调出搜索框,直接搜索自己需要的

(3)连线
如下图很多模块通过线连载在一起,所以使用的时候,要注意哪些可以连接在一起,

(4)输出 提示词
1-正面提示词
提示词分为正面提示词,就是你需要什么样的图片,就加入,写提示词也是需要一些技巧的
Mount Fuji erupted, but in fact it was a grand fireworks display. towering like a cloud in the sky during the day. A spectacular display of fireworks over a lake at night, with Mt. Fuji in the background. The lake is still and calm, reflecting the vibrant colors of the fireworks. The sky is filled with stars, and the lake is surrounded by trees and buildings. The fireworks are exploding in the sky, creating a dazzling display of light and color. The image has a high resolution and a watermark in the bottom right corner.
2-负面提示词
当你不需要的一些元素的时候,就加入的内容。
People and volcanic ash and magma do not exist in Japanese houses.
(5)生成图片
然后点“运行”就会有生成图片了。

生出的图片

4,模块介绍
很多模型开始不知道,只能一步步学习。

🧩 1. Checkpoint加载器(简易)
作用:加载 Stable Diffusion 模型的主权重文件。
输入:无。
输出:
模型(Model)CLIP(文本编码器)VAE(图像解码器)
示例:
RealVisXL_V5.0_fp16.safetensors
这是一个 SDXL 系列高质量写实模型,用于生成逼真的图像。
🔗 输出连接:
→ 连接到两个 “CLIP文本编码器” 节点(正向/反向提示词)
CLIP → 连接到 “VAE解码” 节点
VAE → 连接到 “K采样器(KSampler)”
模型
🟩 2. CLIP文本编码器(正向提示)
作用:把正向提示词(Prompt)转成模型能理解的文本向量。
输入:
来自 Checkpoint 的
CLIP
内容:
Mount Fuji erupted, but in fact it was a grand fireworks display...
描述了富士山背景下的夜晚烟花场景。
输出:
“条件(Conditioning)” → 用于指导生成内容。
🔗 输出连接:
连接到 “K采样器(正面条件)”。
🟥 3. CLIP文本编码器(负向提示)
作用:将反向提示词(Negative Prompt)转成向量,用于告诉模型“不要生成什么”。
输入:
来自 Checkpoint 的
CLIP
内容:
People and volcanic ash and magma do not exist in Japanese houses.
意思是不要有人、火山灰、熔岩这些不希望出现的元素。
输出:
“条件(Conditioning)” → 提供反向引导。
🔗 输出连接:
连接到 “K采样器(负面条件)”。
🔳 4. 空Latent
作用:创建一个“空的潜空间图像”(latent tensor),相当于一块虚拟画布。
参数:
宽度:2040高度:1024批次:1(一次生成一张图)
输出:
(空白潜空间张量)
Latent
🔗 输出连接:
连接到 “K采样器(初始输入)”。
⚙️ 5. K采样器(KSampler)
作用:扩散模型的核心部分,负责根据文本条件从噪声中生成潜空间图像。
输入:
模型(来自 Checkpoint)正面条件(来自绿色 CLIP)负面条件(来自红色 CLIP)初始潜空间(来自 空Latent)
参数说明:
随机种子(Seed):控制生成随机性步数(Steps=30):迭代次数,影响细节与时间CFG=7.0:文本引导强度(越高越贴近提示词)采样算法:(常用平衡算法)噪声强度:1.0 表示完全从随机噪声开始生成
euler_ancestral
输出:
(生成好的潜空间图像)
Latent
🔗 输出连接:
连接到 “VAE解码” 节点。
🧩 6. VAE解码(VAE Decode)
作用:把潜空间图像(latent)解码为可视化的 RGB 图像。
输入:
(来自 KSampler)
Latent(来自 Checkpoint)
VAE
输出:
图像(Image)
🔗 输出连接:
连接到 “预览图像” 和 “保存图像”。
🖼️ 7. 预览图像
作用:实时预览生成结果。输入:来自 VAE 解码的图像。显示结果:在右下角显示生成的烟花图像(2040×1024)。
💾 8. 保存图像(Save Image)
作用:将生成的最终图像保存到本地。输入:图像。输出文件夹:(默认路径)保存名:自动带时间戳或用户命名。
ComfyUI/output
🧠 总体流程总结
Checkpoint加载器
├── CLIP → 正向文本编码器 → KSampler(正面条件)
├── CLIP → 反向文本编码器 → KSampler(负面条件)
├── 模型 → KSampler(核心生成)
└── VAE → VAE解码
空Latent → KSampler → VAE解码 → 预览图像 + 保存图像
整体逻辑:
加载模型与组件(Checkpoint)文本提示词 → 转成编码向量(CLIP)空Latent → 加噪采样(KSampler)解码 → 显示与保存图像
5,细节部分
暂无
6,使用的工作流
资源链接:https://download.csdn.net/download/qq_22146161/92238282
7,总结
这也算各一个开始吧,我也在学习摸索中。