t2i-adapter-lineart-sdxl-1.0

t2i-adapter-lineart-sdxl-1.0

文本与线条艺术的融合应用

T2I Adapter引入线条艺术条件,为StableDiffusionXL模型增强文本到图像生成功能。该项目由腾讯ARC和Hugging Face合作开发,专业处理复杂图像造型和结构。通过Apache 2.0许可证分发,便于集成与扩展。模型的条件设置挖掘更多可控能力,增加艺术与AI图像生成的创意。GitHub库和相关论文提供完整指南和示例,适合开发者与研究人员。

开源项目视觉模型模型Stable Diffusion XL生成模型GithubHuggingface文本到图像边缘检测

t2i-adapter-lineart-sdxl-1.0 项目介绍

项目背景

T2I Adapter 是一个为稳定扩散模型提供附加条件输入的网络。该项目名为“t2i-adapter-lineart-sdxl-1.0”,专注于利用线稿形式的条件输入来生成图像。它的基础模型是稳定扩散 XL 基础版1.0,由腾讯 ARC 和 Hugging Face 联合开发。

模型详情

  • 开发者: T2I-Adapter 由一组学者和开发人员创建,旨在为文本到图像的扩散模型挖掘更多可控能力。
  • 模型类型: 基于扩散的文本到图像生成模型。
  • 使用语言: 英语。
  • 许可证: Apache 2.0。
  • 更多资源: 可查阅该项目的 GitHub 仓库学术论文

模型复杂度

模型的复杂度通过参数的数量得以表现:

类型参数数量
SD-V1.4/1.5860M
SD-XL2.6B
T2I-Adapter77M
T2I-Adapter-SDXL77/79M

Checkpoints

t2i-adapter-lineart-sdxl-1.0 是其中一个关键的检查点,该模型是通过线稿边缘检测进行训练的。下表列出了一些相关的模型及其特性:

模型名称控制图像概览控制图像示例生成图像示例
TencentARC/t2i-adapter-lineart-sdxl-1.0手绘单色线稿Control ImageGenerated Image

使用示范

以下是如何使用 t2i-adapter-lineart-sdxl-1.0 生成图像的简单示例。

依赖安装

要开始使用,首先需要安装一些必要的依赖库:

pip install -U git+https://github.com/huggingface/diffusers.git pip install -U controlnet_aux==0.0.7 pip install transformers accelerate safetensors

代码示例

以下代码将展示如何通过线稿模型生成一个图像:

from diffusers import StableDiffusionXLAdapterPipeline, T2IAdapter, EulerAncestralDiscreteScheduler, AutoencoderKL from controlnet_aux.lineart import LineartDetector import torch # 加载适配器 adapter = T2IAdapter.from_pretrained( "TencentARC/t2i-adapter-lineart-sdxl-1.0", torch_dtype=torch.float16, varient="fp16" ).to("cuda") # 配置其他组件 model_id = 'stabilityai/stable-diffusion-xl-base-1.0' euler_a = EulerAncestralDiscreteScheduler.from_pretrained(model_id, subfolder="scheduler") vae=AutoencoderKL.from_pretrained("madebyollin/sdxl-vae-fp16-fix", torch_dtype=torch.float16) pipe = StableDiffusionXLAdapterPipeline.from_pretrained( model_id, vae=vae, adapter=adapter, scheduler=euler_a, torch_dtype=torch.float16, variant="fp16", ).to("cuda") line_detector = LineartDetector.from_pretrained("lllyasviel/Annotators").to("cuda")
  • 条件图像

我们利用线稿检测工具来准备条件图像:

url = "https://huggingface.co/Adapter/t2iadapter/resolve/main/figs_SDXLV1.0/org_lin.jpg" image = load_image(url) image = line_detector(image, detect_resolution=384, image_resolution=1024)
  • 生成图像

设定提示词进行图像生成:

prompt = "Ice dragon roar, 4k photo" negative_prompt = "anime, cartoon, graphic, text, painting, crayon, graphite, abstract, glitch, deformed, mutated, ugly, disfigured" gen_images = pipe( prompt=prompt, negative_prompt=negative_prompt, image=image, num_inference_steps=30, adapter_conditioning_scale=0.8, guidance_scale=7.5, ).images[0] gen_images.save('out_lin.png')

训练信息

该模型是在 3M 高分辨率图像-文本对上进行训练的,具体配置如下:

  • 训练步数: 20000
  • 批处理大小: 单 GPU 批处理大小为 16,总批处理大小为 256。
  • 学习率: 固定为 1e-5
  • 使用 mixed precision: fp16

t2i-adapter-lineart-sdxl-1.0 提供了更可控的图像生成能力,为用户带来了高效且多样化的创作体验。

编辑推荐精选

扣子-AI办公

扣子-AI办公

职场AI,就用扣子

AI办公助手,复杂任务高效处理。办公效率低?扣子空间AI助手支持播客生成、PPT制作、网页开发及报告写作,覆盖科研、商业、舆情等领域的专家Agent 7x24小时响应,生活工作无缝切换,提升50%效率!

堆友

堆友

多风格AI绘画神器

堆友平台由阿里巴巴设计团队创建,作为一款AI驱动的设计工具,专为设计师提供一站式增长服务。功能覆盖海量3D素材、AI绘画、实时渲染以及专业抠图,显著提升设计品质和效率。平台不仅提供工具,还是一个促进创意交流和个人发展的空间,界面友好,适合所有级别的设计师和创意工作者。

图像生成AI工具AI反应堆AI工具箱AI绘画GOAI艺术字堆友相机AI图像热门
码上飞

码上飞

零代码AI应用开发平台

零代码AI应用开发平台,用户只需一句话简单描述需求,AI能自动生成小程序、APP或H5网页应用,无需编写代码。

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

下拉加载更多