Ghibli-Diffusion

Ghibli-Diffusion项目介绍

Ghibli-Diffusion是一个基于Stable Diffusion模型微调的文本到图像生成模型，专门训练用于生成吉卜力工作室风格的动画图像。这个项目由AI艺术家nitrosocke开发，旨在为用户提供一种生成吉卜力风格图像的便捷工具。

项目特点

吉卜力风格: 该模型通过对现代吉卜力工作室动画电影的图像进行训练，能够生成具有鲜明吉卜力风格的图像。
多样化内容: 模型可以生成各种类型的图像，包括人物、动物、汽车、风景等。
简单使用: 用户只需在提示词中加入"ghibli style"即可激活吉卜力风格效果。
高质量输出: 生成的图像具有高度的细节和艺术性，能够很好地捕捉吉卜力动画的独特魅力。

使用方法

使用Ghibli-Diffusion模型非常简单。用户可以通过Python代码或者Hugging Face提供的在线演示界面来生成图像。以下是一个简单的Python代码示例：

from diffusers import StableDiffusionPipeline
import torch

model_id = "nitrosocke/Ghibli-Diffusion"
pipe = StableDiffusionPipeline.from_pretrained(model_id, torch_dtype=torch.float16)
pipe = pipe.to("cuda")

prompt = "ghibli style magical princess with golden hair"
image = pipe(prompt).images[0]

image.save("./magical_princess.png")

模型训练

Ghibli-Diffusion模型使用了基于diffusers的dreambooth训练方法，采用了prior-preservation loss和train-text-encoder标志，共进行了15,000步的训练。这种训练方法确保了模型能够准确捕捉吉卜力风格的特征，同时保持了原始Stable Diffusion模型的多样性和创造力。