ComfyUI_TensorRT

ComfyUI_TensorRT

利用TensorRT优化稳定扩散模型在NVIDIA RTX显卡上的性能

ComfyUI_TensorRT项目为ComfyUI提供了TensorRT节点,旨在优化NVIDIA RTX显卡上稳定扩散模型的性能。该项目支持多个版本的稳定扩散模型,包括SDXL、SVD和AuraFlow等。通过生成GPU专用的TensorRT引擎,实现了模型运行效率的显著提升。项目支持动态和静态引擎构建,适应不同的分辨率和批量大小需求。此外,项目还提供了详细的安装和使用指南,便于用户在ComfyUI中集成和应用。

TensorRTComfyUINVIDIA GPUAI模型优化稳定扩散Github开源项目

ComfyUI的TensorRT节点

此节点通过利用NVIDIA TensorRT,为NVIDIA RTX™显卡(GPU)上的Stable Diffusion提供最佳性能。

支持:

  • Stable Diffusion 1.5
  • Stable Diffusion 2.1
  • Stable Diffusion 3.0
  • SDXL
  • SDXL Turbo
  • Stable Video Diffusion
  • Stable Video Diffusion-XT
  • AuraFlow

要求:

  • GeForce RTX™或NVIDIA RTX™ GPU
  • 对于SDXL和SDXL Turbo,由于其规模和计算密集性,建议使用具有12 GB或更多VRAM的GPU以获得最佳性能。
  • 对于Stable Video Diffusion (SVD),建议使用具有16 GB或更多VRAM的GPU。
  • 对于Stable Video Diffusion-XT (SVD-XT),建议使用具有24 GB或更多VRAM的GPU。

安装

安装这些节点的推荐方式是使用ComfyUI Manager,轻松将它们安装到您的ComfyUI实例中。

您也可以通过将仓库git克隆到ComfyUI/custom_nodes文件夹并安装要求来手动安装它们,如下所示:

cd custom_nodes
git clone https://github.com/comfyanonymous/ComfyUI_TensorRT
cd ComfyUI_TensorRT
pip install -r requirements.txt

描述

NVIDIA TensorRT允许您为特定的NVIDIA RTX GPU优化AI模型的运行方式,从而释放最高性能。为此,我们需要生成特定于您的GPU的TensorRT引擎。

您可以选择构建动态或静态TensorRT引擎:

  • 动态引擎支持一系列分辨率和批量大小,由最小和最大参数指定。在使用最佳(opt)分辨率和批量大小时会获得最佳性能,因此请为您最常用的分辨率和批量大小指定opt参数。

  • 静态引擎仅支持单一分辨率和批量大小。它们提供与动态引擎最佳设置相同的性能提升。

注意:大多数用户会更喜欢动态引擎,但如果您大部分时间使用特定的分辨率+批量大小组合,静态引擎可能会很有用。静态引擎还需要更少的VRAM;动态范围越广,消耗的VRAM就越多。

使用说明

您可以在此仓库的workflows文件夹中找到不同的工作流程。 这些.json文件可以在ComfyUI中加载。

从检查点构建TensorRT引擎

  1. 添加一个加载检查点节点

  2. 在ComfyUI中添加一个静态模型TensorRT转换节点或动态模型TensorRT转换节点

  3. 将加载检查点模型输出连接到TensorRT转换节点模型输入。

  4. 为了帮助识别转换后的TensorRT模型,提供一个有意义的文件名前缀,将此文件名添加在"tensorrt/"之后

  5. 点击队列提示开始构建TensorRT引擎

在构建TensorRT引擎时,模型转换节点将被突出显示。

有关模型转换过程的其他信息可以在控制台中看到。

首次为检查点生成引擎将需要一段时间。之后为同一检查点生成的额外引擎将会快得多。生成引擎可能需要3-10分钟用于图像生成模型,10-25分钟用于SVD。SVD-XT是一个极其庞大的模型 - 引擎构建时间可能需要长达一小时。


使用TensorRT引擎加速图像生成

TensorRT引擎使用TensorRT加载器节点加载。

常见问题/限制

ComfyUI TensorRT引擎目前还不兼容ControlNets或LoRAs。在未来的更新中将启用兼容性。

  1. 添加一个TensorRT加载器节点

  2. 注意,如果在ComfyUI会话期间创建了TensorRT引擎,在刷新ComfyUI界面之前,它不会显示在TensorRT加载器中(F5刷新浏览器)。

  3. 从unet_name下拉列表中选择一个TensorRT引擎

  4. 动态引擎将使用以下文件名格式:

  5. dyn-b-min-max-opt-h-min-max-opt-w-min-max-opt

  6. dyn=动态,b=批量大小,h=高度,w=宽度

  7. 静态引擎将使用以下文件名格式:

  8. stat-b-opt-h-opt-w-opt

  9. stat=静态,b=批量大小,h=高度,w=宽度

  10. model_type必须与TensorRT引擎的模型类型匹配。

  11. 工作流程的CLIP和VAE需要从原始模型检查点使用,TensorRT加载器的MODEL输出将连接到采样器。

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多