
利用TensorRT优化稳定扩散模型在NVIDIA RTX显卡上的性能
ComfyUI_TensorRT项目为ComfyUI提供了TensorRT节点,旨在优化NVIDIA RTX显卡上稳定扩散模型的性能。该项目支持多个版本的稳定扩散模型,包括SDXL、SVD和AuraFlow等。通过生成GPU专用的TensorRT引擎,实现了模型运行效率的显著提升。项目支持动态和静态引擎构建,适应不同的分辨率和批量大小需求。此外,项目还提供了详细的安装和使用指南,便于用户在ComfyUI中集成和应用。
此节点通过利用NVIDIA TensorRT,为NVIDIA RTX™显卡(GPU)上的Stable Diffusion提供最佳性能。
支持:
要求:
安装这些节点的推荐方式是使用ComfyUI Manager,轻松将它们安装到您的ComfyUI实例中。
您也可以通过将仓库git克隆到ComfyUI/custom_nodes文件夹并安装要求来手动安装它们,如下所示:
cd custom_nodes
git clone https://github.com/comfyanonymous/ComfyUI_TensorRT
cd ComfyUI_TensorRT
pip install -r requirements.txt
NVIDIA TensorRT允许您为特定的NVIDIA RTX GPU优化AI模型的运行方式,从而释放最高性能。为此,我们需要生成特定于您的GPU的TensorRT引擎。
您可以选择构建动态或静态TensorRT引擎:
动态引擎支持一系列分辨率和批量大小,由最小和最大参数指定。在使用最佳(opt)分辨率和批量大小时会获得最佳性能,因此请为您最常用的分辨率和批量大小指定opt参数。
静态引擎仅支持单一分辨率和批量大小。它们提供与动态引擎最佳设置相同的性能提升。
注意:大多数用户会更喜欢动态引擎,但如果您大部分时间使用特定的分辨率+批量大小组 合,静态引擎可能会很有用。静态引擎还需要更少的VRAM;动态范围越广,消耗的VRAM就越多。
您可以在此仓库的workflows文件夹中找到不同的工作流程。 这些.json文件可以在ComfyUI中加载。
添加一个加载检查点节点
在ComfyUI中添加一个静态模型TensorRT转换节点或动态模型TensorRT转换节点

将加载检查点模型输出连接到TensorRT转换节点模型输入。


为了帮助识别转换后的TensorRT模型,提供一个有意义的文件名前缀,将此文件名添加在"tensorrt/"之后

点击队列提示开始构建TensorRT引擎


在构建TensorRT引擎时,模型转换节点将被突出显示。
有关模型转换过程的其他信息可以在控制台中看到。

首次为检查点生成引擎将需要一段时间。之后为同一检查点生成的额外引擎将会快得多。生成引擎可能需要3-10分钟用于图像生成模型,10-25分钟用于SVD。SVD-XT是一个极其庞大的模型 - 引擎构建时间可能需要长达一小时。
TensorRT引擎使用TensorRT加载器节点加载。

ComfyUI TensorRT引擎目前还不兼容ControlNets或LoRAs。在未来的更新中将启用兼容性。
添加一个TensorRT加载器节点
注意,如果在ComfyUI会话期间创建了TensorRT引擎,在刷新ComfyUI界面之前,它不会显示在TensorRT加载器中(F5刷新浏览器)。

从unet_name下拉列表中选择一个TensorRT引擎
动态引擎将使用以下文件名格式:
dyn-b-min-max-opt-h-min-max-opt-w-min-max-opt
dyn=动态,b=批量大小,h=高度,w=宽度
静态引擎将使用以下文件名格式:
stat-b-opt-h-opt-w-opt
stat=静态,b=批量大小,h=高度,w=宽度

model_type必须与TensorRT引擎的模型类型匹配。

工作流程的CLIP和VAE需要从原始模型检查点使用,TensorRT加载器的MODEL输出将连接到采样器。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。


AI论文写作指导平台
AIWritePaper论文写作是一站式AI论文写作辅助工具, 简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。


AI一键生成PPT,就用博思AIPPT!
博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。


AI赋能电商视觉革命,一站式智能商拍平台
潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。


企业专属的AI法律顾问
iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。


稳定高效的流量提升解决方案,助力品牌曝光
稳定高效的流量提升解决方案,助力品牌曝光


最新版Sora2模型免费使用,一键生成无水印视频
最新版Sora2模型免费使用,一键生成无水印视频
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号