ComfyUI

ComfyUI

模块化Stable Diffusion工作流设计与执行工具

ComfyUI是一个开源的Stable Diffusion工作流设计工具。它采用图形化界面,支持通过节点和流程图创建复杂的AI图像生成流程。ComfyUI兼容多种Stable Diffusion模型,包括SD1.x、SD2.x和SDXL等。该工具具有异步队列系统和智能内存管理,优化了资源使用。ComfyUI还集成了LoRA、ControlNet等技术,可保存和加载完整工作流,为用户提供灵活的AI图像生成体验。

ComfyUIAI绘图Stable Diffusion工作流GPUGithub开源项目

ComfyUI

最强大、最模块化的稳定扩散GUI和后端。

ComfyUI截图

这个界面允许您使用基于图表/节点/流程图的接口设计和执行高级稳定扩散流程。要查看一些工作流示例并了解ComfyUI的功能,您可以查看:

ComfyUI示例

安装ComfyUI

功能

工作流示例可以在示例页面找到

快捷键

快捷键说明
Ctrl + Enter将当前图表排队生成
Ctrl + Shift + Enter将当前图表排在生成队列的首位
Ctrl + Z/Ctrl + Y撤销/重做
Ctrl + S保存工作流
Ctrl + O加载工作流
Ctrl + A选择所有节点
Alt + C折叠/展开选定的节点
Ctrl + M静音/取消静音选定的节点
Ctrl + B绕过选定的节点(就像节点从图表中移除并重新连接线路一样)
Delete/Backspace删除选定的节点
Ctrl + Backspace删除当前图表
Space按住并移动光标时移动画布
Ctrl/Shift + 点击将点击的节点添加到选择中
Ctrl + C/Ctrl + V复制和粘贴选定的节点(不保持与未选定节点输出的连接)
Ctrl + C/Ctrl + Shift + V复制和粘贴选定的节点(保持未选定节点输出到粘贴节点输入的连接)
Shift + 拖动同时移动多个选定的节点
Ctrl + D加载默认图表
Alt + +画布放大
Alt + -画布缩小
Ctrl + Shift + 左键 + 垂直拖动画布放大/缩小
Q切换队列的可见性
H切换历史记录的可见性
R刷新图表
左键双击打开节点快速搜索面板

对于macOS用户,Ctrl也可以替换为Cmd

安装

Windows

发布页面上有一个适用于Windows的便携式独立版本,可用于在Nvidia GPU上运行或仅在CPU上运行。

直接下载链接

只需下载,用7-Zip解压并运行即可。确保将Stable Diffusion检查点/模型(大型ckpt/safetensors文件)放在:ComfyUI\models\checkpoints

如果解压有困难,右键点击文件 -> 属性 -> 解除锁定

如何在另一个UI和ComfyUI之间共享模型?

请参阅配置文件来设置模型的搜索路径。在Windows独立版中,你可以在ComfyUI目录中找到这个文件。将此文件重命名为extra_model_paths.yaml,并用你喜欢的文本编辑器编辑它。

Jupyter Notebook

要在paperspace、kaggle或colab等服务上运行,你可以使用我的Jupyter Notebook

手动安装(Windows、Linux)

Git克隆此仓库。

将SD检查点(大型ckpt/safetensors文件)放在:models/checkpoints

将VAE放在:models/vae

AMD GPU(仅限Linux)

AMD用户可以通过pip安装rocm和pytorch(如果尚未安装),这是安装稳定版本的命令:

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/rocm6.0

这是安装带有ROCm 6.0的每晚版本的命令,可能会有一些性能改进:

pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/rocm6.1

NVIDIA

Nvidia用户应使用此命令安装稳定版pytorch:

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu121

这是安装pytorch每晚版本的命令,可能会有性能改进:

pip install --pre torch torchvision torchaudio --index-url https://download.pytorch.org/whl/nightly/cu124

故障排除

如果出现"Torch not compiled with CUDA enabled"错误,请使用以下命令卸载torch:

pip uninstall torch

然后使用上面的命令重新安装。

依赖项

通过在ComfyUI文件夹内打开终端并执行以下命令来安装依赖项:

pip install -r requirements.txt

完成后,您应该已安装所有内容,可以继续运行ComfyUI。

其他:

Intel GPU

Intel GPU支持适用于所有受Intel的Pytorch扩展(IPEX)支持的Intel GPU,支持要求列在安装页面。选择您的平台和安装方法,并按照说明进行操作。步骤如下:

  1. 首先安装IPEX安装页面中列出的或更新的驱动程序或内核(如果需要)。
  2. 按照说明为您的平台安装Intel的oneAPI Basekit
  3. 使用安装页面中为您的平台提供的说明安装IPEX的软件包。
  4. 按照Windows和Linux的ComfyUI手动安装说明进行操作,并在安装完所有内容后正常运行ComfyUI。

更多讨论和帮助可以在这里找到。

Apple Mac芯片

您可以在任何最新版本的macOS上的Apple Mac芯片(M1或M2)上安装ComfyUI。

  1. 安装 PyTorch 夜间版。有关说明,请阅读 Apple 开发者指南中的 Mac 上加速 PyTorch 训练(确保安装最新的 PyTorch 夜间版)。
  2. 按照 Windows 和 Linux 的 ComfyUI 手动安装 说明进行操作。
  3. 安装 ComfyUI 依赖项。如果你已经有其他 Stable Diffusion UI,你可能可以重复使用这些依赖项
  4. 运行 python main.py 启动 ComfyUI。

注意:记得将你的模型、VAE、LoRA 等添加到相应的 Comfy 文件夹中,如 ComfyUI 手动安装 中所讨论的。

DirectML(Windows 上的 AMD 显卡)

pip install torch-directml 然后你可以用以下命令启动 ComfyUI:python main.py --directml

运行

python main.py

对于 ROCm 不官方支持的 AMD 显卡

如果遇到问题,请尝试使用以下命令运行:

对于 6700、6600 和其他可能的 RDNA2 或更旧型号:HSA_OVERRIDE_GFX_VERSION=10.3.0 python main.py

对于 AMD 7600 和其他可能的 RDNA3 显卡:HSA_OVERRIDE_GFX_VERSION=11.0.0 python main.py

注意事项

只有图中具有所有正确输入的输出部分才会被执行。

只有从一次执行到下一次执行发生变化的图的部分才会被执行,如果你提交相同的图两次,只有第一次会被执行。如果你只更改图的最后部分,只有你更改的部分和依赖它的部分会被执行。

在网页上拖放生成的 png 或加载一个 png 会给你包括用于创建它的种子在内的完整工作流程。

你可以使用 () 来改变单词或短语的强调,比如:(good code:1.2) 或 (bad code:0.8)。() 的默认强调度为 1.1。要在实际提示中使用 () 字符,请使用转义符,如 \( 或 \)。

你可以使用 {day|night} 进行通配符/动态提示。使用这种语法,"{wild|card|test}" 每次你队列提示时,前端会随机将其替换为 "wild"、"card" 或 "test" 中的一个。要在实际提示中使用 {} 字符,请使用转义符,如 \{ 或 \}。

动态提示还支持 C 风格的注释,如 // 注释/* 注释 */

要在文本提示中使用文本反转概念/嵌入,将它们放在 models/embeddings 目录中,并在 CLIPTextEncode 节点中这样使用(可以省略 .pt 扩展名):

embedding:embedding_filename.pt

如何显示高质量预览?

使用 --preview-method auto 启用预览。

默认安装包含一个快速的低分辨率潜在预览方法。要启用更高质量的预览,使用 TAESD,下载 taesd_decoder.pth(用于 SD1.x 和 SD2.x)和 taesdxl_decoder.pth(用于 SDXL)模型,并将它们放在 models/vae_approx 文件夹中。安装完成后,重启 ComfyUI 以启用高质量预览。

如何使用 TLS/SSL?

通过运行以下命令生成自签名证书(不适合共享/生产使用)和密钥:openssl req -x509 -newkey rsa:4096 -keyout key.pem -out cert.pem -sha256 -days 3650 -nodes -subj "/C=XX/ST=StateName/L=CityName/O=CompanyName/OU=CompanySectionName/CN=CommonNameOrHostname"

使用 --tls-keyfile key.pem --tls-certfile cert.pem 启用 TLS/SSL,现在应用将可以通过 https://... 而不是 http://... 访问。

注意:Windows 用户可以使用 alexisrolland/docker-openssl第三方二进制发行版 之一来运行上述命令示例。 <br/><br/>如果你使用容器,请注意卷挂载 -v 可以是相对路径,所以 ... -v ".\:/openssl-certs" ... 会在你的命令提示符或 PowerShell 终端的当前目录中创建密钥和证书文件。

支持和开发频道

Matrix 空间:#comfyui_space:matrix.org(它类似于 Discord,但是开源的)。

另见:https://www.comfy.org/

问答

我应该为此购买哪种 GPU?

查看此页面获取一些建议

编辑推荐精选

Keevx

Keevx

AI数字人视频创作平台

Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。

即梦AI

即梦AI

一站式AI创作平台

提供 AI 驱动的图片、视频生成及数字人等功能,助力创意创作

扣子-AI办公

扣子-AI办公

AI办公助手,复杂任务高效处理

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
蛙蛙写作

蛙蛙写作

AI小说写作助手,一站式润色、改写、扩写

蛙蛙写作—国内先进的AI写作平台,涵盖小说、学术、社交媒体等多场景。提供续写、改写、润色等功能,助力创作者高效优化写作流程。界面简洁,功能全面,适合各类写作者提升内容品质和工作效率。

AI辅助写作AI工具蛙蛙写作AI写作工具学术助手办公助手营销助手AI助手
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

热门AI助手AI对话AI工具聊天机器人
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

下拉加载更多