快速高质量文本到图像生成的突破性模型
SDXL-Lightning是一个基于稳定扩散XL的文本到图像生成模型,能在几步内生成1024px高质量图像。它提供1步、2步、4步和8步蒸馏模型,其中2步、4步和8步模型在保持高速的同时,展现出优秀的生成质量。该项目开源了完整的UNet和LoRA检查点,方便用户在各种场景中应用。
SDXL-Lightning是一个闪电般快速的文本到图像生成模型。这个项目由ByteDance开发,旨在实现高效率、高质量的图像生成。以下是对该项目的详细介绍:
SDXL-Lightning能够在几个步骤内生成高质量的1024像素图像。该模型是通过对stabilityai/stable-diffusion-xl-base-1.0进行蒸馏而得到的。项目提供了1步、2步、4步和8步的蒸馏模型检查点,其中2步、4步和8步模型的生成质量令人惊叹,而1步模型则更具实验性。
项目提供了多种检查点文件:
使用时需注意选择与推理步骤相对应的正确检查点。
SDXL-Lightning支持多种使用方式:
Diffusers库:
ComfyUI:
项目还包含一个实验性的1步模型:
SDXL-Lightning通过提高图像生成速度和质量,为文本到图像生成领域带来了重要突破。 它不仅可以应用于快速原型设计,还可能在实时图像生成等场景中发挥重要作用。
随着研究的深入,SDXL-Lightning有望在速度和质量方面取得进一步突破。社区的参与和反馈将推动项目不断完善和发展。
项目基于研究论文《SDXL-Lightning: Progressive Adversarial Diffusion Distillation》。使用本项目成果时,建议引用该论文以示感谢。