openvision

OpenVision项目介绍

OpenVision是一个令人兴奋的图像生成项目，其亮点在于将著名的Midjourney美学风格无缝融入用户生成的每一幅图像中。通过引入这个美学风格，OpenVision使用户不再需要进行手动调整或后期处理即可生成高质量的图像。

项目背景

OpenVision基于ProteusV0.4的风格增强功能进行开发，其核心在于通过开放的人工智能网络Bittensor生成合成图像。Bittensor的目标是去中心化人工智能，通过构建先进的开源模型来推动技术的发展。OpenVision可以被视为实现这一宏伟目标的小步伐。

项目的亮点

OpenVision以其独特的Midjourney风格著称，尤其在肖像细节的保留和风格的高度一致性方面表现出色。这种风格直接嵌入到模型中，使得用户在图像生成时无需多余的调整。

理想的设置

为了获得最佳的图像效果，OpenVision建议使用以下的参数设置：

控制字段（CFG）范围：1.5 - 2
采样器：Euler Ancestral
步数：30 - 40
分辨率：1280x1280（提高美学）或1024x1024（提高保真度）

使用方法

OpenVision与🤗 diffusers兼容，可以通过简单的代码实现图像生成。以下是一个使用Python和Pytorch的示例：

import torch
from diffusers import (
    StableDiffusionXLPipeline, 
    AutoencoderKL
)

# 加载VAE组件
vae = AutoencoderKL.from_pretrained(
    "madebyollin/sdxl-vae-fp16-fix", 
    torch_dtype=torch.float16
)

# 配置管道
pipe = StableDiffusionXLPipeline.from_pretrained(
    "Corcelio/openvision", 
    vae=vae,
    torch_dtype=torch.float16
)
pipe.to('cuda')

# 定义提示并生成图像
prompt = "a cat wearing sunglasses in the summer"
negative_prompt = ""

image = pipe(
    prompt, 
    negative_prompt=negative_prompt, 
    width=1280,
    height=1280,
    guidance_scale=1.5,
    num_inference_steps=30
).images[0]