waifu-diffusion

waifu-diffusion项目介绍

waifu-diffusion项目是一个专注于二次元图像生成的项目，采用了文本到图像的扩散模型，经过精调以更好地生成高质量的动漫图像。

项目概况

waifu-diffusion模型可以将文本描述转化为相应的二次元图像。该模型通过高质量的动漫图像进行训练，从而提高了生成结果的清晰度和逼真度。无论是画面中的人物形象还是色彩细节，waifu-diffusion都能准确捕捉，满足用户对动漫风格图像的需求。

使用方式

waifu-diffusion项目支持通过Gradio Web界面和Colab在线运行。这两种方式都能轻松调用模型进行图像生成，无需用户具备编程背景。

模型详情

waifu-diffusion使用的是Stable Diffusion技术，通过预训练的模型进行推理。用户可以通过输入文本描述生成所需的动漫风格图像。例如，用户可以使用以下代码开始生成：

import torch
from torch import autocast
from diffusers import StableDiffusionPipeline

pipe = StableDiffusionPipeline.from_pretrained(
    'hakurei/waifu-diffusion',
    torch_dtype=torch.float32
).to('cuda')

prompt = "1girl, aqua eyes, baseball cap, blonde hair, closed mouth, earrings, green background, hat, hoop earrings, jewelry, looking at viewer, shirt, short hair, simple background, solo, upper body, yellow shirt"
with autocast("cuda"):
    image = pipe(prompt, guidance_scale=6)["sample"][0]  

image.save("test.png")