项目简介

Segmind 稳定扩散模型 (SSD-1B) 是稳定扩散 XL (SDXL) 缩小 50% 的精简版本，可为模型的运行提供 60% 的提速，同时保持高质量的文本到图像生成功能。它已经过各种数据集的训练，包括 Grit 和 Midjourney scrap 数据，以增强其根据文本提示创建各种视觉内容的能力。

项目图片

该模型采用知识蒸馏策略，连续利用多个专家模型（包括SDXL、ZavyChromaXL和 JuggernautXL）的教学，结合它们的优势并产生令人印象深刻的视觉输出。

功能特征

文本到图像生成： 该模型擅长根据文本提示生成图像，从而实现广泛的创意应用。
精炼速度： 该模型专为提高效率而设计，可提供 60% 的加速，使其成为实时应用程序和需要快速生成图像的场景的实用选择。
多样化的训练数据： 模型经过多样化的数据集训练，可以处理各种文本提示并有效生成相应的图像。
知识蒸馏： 通过从多个专家模型中蒸馏知识，Segmind 稳定扩散模型结合了它们的优点并最大限度地减少了它们的局限性，从而提高了性能。

生图效果对比（SDXL-1.0 与 SSD-1B）

生图效果对比

使用方法

该模型可以通过 🧨 Diffusers 库使用。
确保通过运行从源安装扩散器

pip install git+https://github.com/huggingface/diffusers

此外，请安装 transformers、safetensors 和 accelerate：

pip install transformers accelerate safetensors

要使用该模型，您可以运行以下命令：

from diffusers import StableDiffusionXLPipeline
import torch
pipe = StableDiffusionXLPipeline.from_pretrained("segmind/SSD-1B", torch_dtype=torch.float16, use_safetensors=True, variant="fp16")
pipe.to("cuda")
# if using torch < 2.0
# pipe.enable_xformers_memory_efficient_attention()
prompt = "An astronaut riding a green horse" # Your prompt here
neg_prompt = "ugly, blurry, poor quality" # Negative prompt here
image = pipe(prompt=prompt, negative_prompt=neg_prompt).images[0]