ComfyUI

ComfyUI

模块化Stable Diffusion工作流设计与执行工具

ComfyUI是一个开源的Stable Diffusion工作流设计工具。它采用图形化界面,支持通过节点和流程图创建复杂的AI图像生成流程。ComfyUI兼容多种Stable Diffusion模型,包括SD1.x、SD2.x和SDXL等。该工具具有异步队列系统和智能内存管理,优化了资源使用。ComfyUI还集成了LoRA、ControlNet等技术,可保存和加载完整工作流,为用户提供灵活的AI图像生成体验。

ComfyUIAI绘图Stable Diffusion工作流GPUGithub开源项目

ComfyUI

最强大、最模块化的稳定扩散GUI和后端。

ComfyUI截图

这个界面允许您使用基于图表/节点/流程图的接口设计和执行高级稳定扩散流程。要查看一些工作流示例并了解ComfyUI的功能,您可以查看:

ComfyUI示例

安装ComfyUI

功能

工作流示例可以在示例页面找到

快捷键

快捷键说明
Ctrl + Enter将当前图表排队生成
Ctrl + Shift + Enter将当前图表排在生成队列的首位
Ctrl + Z/Ctrl + Y撤销/重做
Ctrl + S保存工作流
Ctrl + O加载工作流
Ctrl + A选择所有节点
Alt + C折叠/展开选定的节点
Ctrl + M静音/取消静音选定的节点
Ctrl + B绕过选定的节点(就像节点从图表中移除并重新连接线路一样)
Delete/Backspace删除选定的节点
Ctrl + Backspace删除当前图表
Space按住并移动光标时移动画布
Ctrl/Shift + 点击将点击的节点添加到选择中
Ctrl + C/Ctrl + V复制和粘贴选定的节点(不保持与未选定节点输出的连接)
Ctrl + C/Ctrl + Shift + V复制和粘贴选定的节点(保持未选定节点输出到粘贴节点输入的连接)
Shift + 拖动同时移动多个选定的节点
Ctrl + D加载默认图表
Alt + +画布放大
Alt + -画布缩小
Ctrl + Shift + 左键 + 垂直拖动画布放大/缩小
Q切换队列的可见性
H切换历史记录的可见性
R刷新图表
左键双击打开节点快速搜索面板

对于macOS用户,Ctrl也可以替换为Cmd

安装

Windows

发布页面上有一个适用于Windows的便携式独立版本,可用于在Nvidia GPU上运行或仅在CPU上运行。

直接下载链接

只需下载,用7-Zip解压并运行即可。确保将Stable Diffusion检查点/模型(大型ckpt/safetensors文件)放在:ComfyUI\models\checkpoints

如果解压有困难,右键点击文件 -> 属性 -> 解除锁定

如何在另一个UI和ComfyUI之间共享模型?

请参阅配置文件来设置模型的搜索路径。在Windows独立版中,你可以在ComfyUI目录中找到这个文件。将此文件重命名为extra_model_paths.yaml,并用你喜欢的文本编辑器编辑它。

Jupyter Notebook

要在paperspace、kaggle或colab等服务上运行,你可以使用我的Jupyter Notebook

手动安装(Windows、Linux)

Git克隆此仓库。

将SD检查点(大型ckpt/safetensors文件)放在:models/checkpoints

将VAE放在:models/vae

AMD GPU(仅限Linux)

AMD用户可以通过pip安装rocm和pytorch(如果尚未安装),这是安装稳定版本的命令:

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm6.0

这是安装带有ROCm 6.0的每晚版本的命令,可能会有一些性能改进:

pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/rocm6.1

NVIDIA

Nvidia用户应使用此命令安装稳定版pytorch:

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121

这是安装pytorch每晚版本的命令,可能会有性能改进:

pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu124

故障排除

如果出现"Torch not compiled with CUDA enabled"错误,请使用以下命令卸载torch:

pip uninstall torch

然后使用上面的命令重新安装。

依赖项

通过在ComfyUI文件夹内打开终端并执行以下命令来安装依赖项:

pip install -r requirements.txt

完成后,您应该已安装所有内容,可以继续运行ComfyUI。

其他:

Intel GPU

Intel GPU支持适用于所有受Intel的Pytorch扩展(IPEX)支持的Intel GPU,支持要求列在安装页面。选择您的平台和安装方法,并按照说明进行操作。步骤如下:

  1. 首先安装IPEX安装页面中列出的或更新的驱动程序或内核(如果需要)。
  2. 按照说明为您的平台安装Intel的oneAPI Basekit
  3. 使用安装页面中为您的平台提供的说明安装IPEX的软件包。
  4. 按照Windows和Linux的ComfyUI手动安装说明进行操作,并在安装完所有内容后正常运行ComfyUI。

更多讨论和帮助可以在这里找到。

Apple Mac芯片

您可以在任何最新版本的macOS上的Apple Mac芯片(M1或M2)上安装ComfyUI。

  1. 安装 PyTorch 夜间版。有关说明,请阅读 Apple 开发者指南中的 Mac 上加速 PyTorch 训练(确保安装最新的 PyTorch 夜间版)。
  2. 按照 Windows 和 Linux 的 ComfyUI 手动安装 说明进行操作。
  3. 安装 ComfyUI 依赖项。如果你已经有其他 Stable Diffusion UI,你可能可以重复使用这些依赖项
  4. 运行 python main.py 启动 ComfyUI。

注意:记得将你的模型、VAE、LoRA 等添加到相应的 Comfy 文件夹中,如 ComfyUI 手动安装 中所讨论的。

DirectML(Windows 上的 AMD 显卡)

pip install torch-directml 然后你可以用以下命令启动 ComfyUI:python main.py --directml

运行

python main.py

对于 ROCm 不官方支持的 AMD 显卡

如果遇到问题,请尝试使用以下命令运行:

对于 6700、6600 和其他可能的 RDNA2 或更旧型号:HSA_OVERRIDE_GFX_VERSION=10.3.0 python main.py

对于 AMD 7600 和其他可能的 RDNA3 显卡:HSA_OVERRIDE_GFX_VERSION=11.0.0 python main.py

注意事项

只有图中具有所有正确输入的输出部分才会被执行。

只有从一次执行到下一次执行发生变化的图的部分才会被执行,如果你提交相同的图两次,只有第一次会被执行。如果你只更改图的最后部分,只有你更改的部分和依赖它的部分会被执行。

在网页上拖放生成的 png 或加载一个 png 会给你包括用于创建它的种子在内的完整工作流程。

你可以使用 () 来改变单词或短语的强调,比如:(good code:1.2) 或 (bad code:0.8)。() 的默认强调度为 1.1。要在实际提示中使用 () 字符,请使用转义符,如 \( 或 \)。

你可以使用 {day|night} 进行通配符/动态提示。使用这种语法,"{wild|card|test}" 每次你队列提示时,前端会随机将其替换为 "wild"、"card" 或 "test" 中的一个。要在实际提示中使用 {} 字符,请使用转义符,如 \{ 或 \}。

动态提示还支持 C 风格的注释,如 // 注释/* 注释 */

要在文本提示中使用文本反转概念/嵌入,将它们放在 models/embeddings 目录中,并在 CLIPTextEncode 节点中这样使用(可以省略 .pt 扩展名):

embedding:embedding_filename.pt

如何显示高质量预览?

使用 --preview-method auto 启用预览。

默认安装包含一个快速的低分辨率潜在预览方法。要启用更高质量的预览,使用 TAESD,下载 taesd_decoder.pth(用于 SD1.x 和 SD2.x)和 taesdxl_decoder.pth(用于 SDXL)模型,并将它们放在 models/vae_approx 文件夹中。安装完成后,重启 ComfyUI 以启用高质量预览。

如何使用 TLS/SSL?

通过运行以下命令生成自签名证书(不适合共享/生产使用)和密钥:openssl req -x509 -newkey rsa:4096 -keyout key.pem -out cert.pem -sha256 -days 3650 -nodes -subj "/C=XX/ST=StateName/L=CityName/O=CompanyName/OU=CompanySectionName/CN=CommonNameOrHostname"

使用 --tls-keyfile key.pem --tls-certfile cert.pem 启用 TLS/SSL,现在应用将可以通过 https://... 而不是 http://... 访问。

注意:Windows 用户可以使用 alexisrolland/docker-openssl第三方二进制发行版 之一来运行上述命令示例。 <br/><br/>如果你使用容器,请注意卷挂载 -v 可以是相对路径,所以 ... -v ".\:/openssl-certs" ... 会在你的命令提示符或 PowerShell 终端的当前目录中创建密钥和证书文件。

支持和开发频道

Matrix 空间:#comfyui_space:matrix.org(它类似于 Discord,但是开源的)。

另见:https://www.comfy.org/

问答

我应该为此购买哪种 GPU?

查看此页面获取一些建议

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多