Draw2Img

Draw2Img

交互式文本引导图像生成工具 - 适用于各年龄段

Draw2Img是一款开源的AI图像生成工具,基于SDXL-Turbo模型。它提供简洁的网页界面,包含基本绘画功能和颜色选择器,支持实时文本引导图像生成。用户可自定义提示词、种子、步骤和强度参数,并可导出生成结果。支持多用户并发和离线使用,适合局域网环境,注重隐私保护。

Draw2ImgAI绘图图像生成开源项目Web界面Github

Draw2Img

一个简单的网页界面,用于交互式文本引导的图像到图像生成,适合任何年龄和技能水平的用户。

<img src="https://yellow-cdn.veclightyear.com/0a4dffa0/7314bc56-8c62-430e-8580-baf67921dd9f.gif" width="48%"></img> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/ca3bf6fc-73d2-409c-acf1-bebfcb48eddf.gif" width="48%"></img>

社区展示

"海浪,日落,光线,照片,35毫米数码,4K"

<img src="https://yellow-cdn.veclightyear.com/0a4dffa0/56ecca43-6822-4306-bfc1-973cf506425f.png" alt="海浪,日落,光线,照片,35毫米数码,4K" />

你用Draw2Img创作了酷炫的作品吗?在这里展示你的艺术作品!

特性

  • 基于网页的界面,带有基本绘画工具和颜色选择器的交互式画布
  • 通过SDXL-Turbo实现实时文本引导的图像到图像生成(512 x 512像素)
  • 可编辑的提示词、种子、步骤和强度参数
  • 导出按钮,可将输入和输出图像保存为PNG文件,并将参数保存为JSON
  • 多线程服务器支持多个并发用户
    • 易于在局域网上托管,与家人和朋友一起享受创意乐趣
  • 本地(无需互联网)、私密且开源

要求

硬件:

  • 推荐使用至少10 GB显存的GPU,但不是严格要求
  • 支持仅CPU环境,但图像生成速度会显著降低

操作系统:

  • Linux、Mac或Windows

软件:

  • Python >= 3.10 且 <= 3.11

浏览器:

  • 任何现代浏览器(Firefox、Chrome、Edge、Safari等)

互联网:

  • 不需要(首次运行时下载模型除外)

使用方法

安装

克隆此仓库

git clone https://github.com/GradientSurfer/Draw2Img.git

安装依赖

pip install .

启动服务器

启动服务器,默认将在http://localhost:8080上监听

python draw2img/main.py

通过浏览器导航到HTTP URL,就这样,开始享受吧!

选项

你可以通过--host--port选项在特定接口和端口上托管服务器。例如,要在192.168.1.123:4269上监听:

python draw2img/main.py --host 192.168.1.123 --port 4269

查看所有可用选项

python draw2img/main.py --help

容器(Docker/Podman)

你可以使用提供的Dockerfile来构建和运行容器镜像:

DOCKER_BUILDKIT=1 docker build -t draw2img .

请务必挂载你的 huggingface 缓存目录,以避免每次容器启动时都下载 SDXL-Turbo 模型(-v ~/.cache/huggingface:/root/.cache/huggingface)。要使用 GPU,你需要添加 --gpus all 选项。

docker run -it -p 8080:8080 -p 8079:8079 -v ~/.cache/huggingface:/root/.cache/huggingface --gpus all draw2img

开发

服务器

以可编辑模式安装 Python 包

pip install -e .

用户界面

可以手动构建用户界面(静态文件输出到 dist 文件夹)

cd draw2img/ui npm run build

或者,Vue 3 模板自带文件服务器和热重载功能,方便开发

npm run dev

容器(Docker/Podman)

你可以使用已包含 UI 工具链(node:lts-slim)的容器镜像,避免在主机上安装 nodenpm

cd draw2img/ui # 构建 UI docker run -it -v $(pwd):/ui -p 5173:5173 node:lts-slim bash -c "cd ui && npm run build" # 或运行开发服务器 docker run -it -v $(pwd):/ui -p 5173:5173 node:lts-slim bash -c "cd ui && npm run dev -- --host"

设计说明

后端是一个多线程 Python websocket 服务器,同时也提供 Web UI 的静态文件服务。

前端是一个 JS/TS 应用程序(Vue 3),通过 npm create vue@latest 引导创建。构建产生的静态文件可以用任何 Web 服务器软件提供服务。

性能

虽然 websocket 服务器是多线程的,但由于单例 Pipeline 对象不是线程安全的,所以使用互斥锁保护它。这意味着图像生成实际上是单线程的,因此随着并发用户数量的增加,性能可能会变差,CPU/GPU 资源可能未被充分利用。此外,由于缺乏对某些参数(如强度和步数)在单个批次内的样本之间进行变化的底层支持,没有对推理请求进行批处理。

实际上,多线程/锁原语表现出一定程度的公平性,所以即使输入请求排队,有限的 CPU/GPU 资源也似乎在并发用户之间相对均匀地共享。不过从技术上讲,Python 并不保证在锁争用时线程调度的顺序(根据文档)。

如果你需要更高的并发性,并且有可用的内存/显存和计算资源,可以考虑启动多个 draw2img 进程实例。

安全性

此代码尚未经过漏洞审核。

贡献

欢迎贡献!在开启 PR 或 issue 时,请牢记本项目的宗旨。

安全性

没有安全过滤器来防止生成令人反感或不适当的图像,请谨慎使用。像平常使用电脑/互联网一样,请监督儿童。

非目标 / 其他项目

如果你是寻找更多功能的高级用户,其他项目如 Stable Diffusion Web UIComfyUI 可能更适合你的需求。

许可证

MIT

请参阅 Stability AI 针对 SDXL-Turbo 的非商业许可证 和他们的可接受使用政策

星标历史

星标历史图表

编辑推荐精选

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
商汤小浣熊

商汤小浣熊

最强AI数据分析助手

小浣熊家族Raccoon,您的AI智能助手,致力于通过先进的人工智能技术,为用户提供高效、便捷的智能服务。无论是日常咨询还是专业问题解答,小浣熊都能以快速、准确的响应满足您的需求,让您的生活更加智能便捷。

imini AI

imini AI

像人一样思考的AI智能体

imini 是一款超级AI智能体,能根据人类指令,自主思考、自主完成、并且交付结果的AI智能体。

Keevx

Keevx

AI数字人视频创作平台

Keevx 一款开箱即用的AI数字人视频创作平台,广泛适用于电商广告、企业培训与社媒宣传,让全球企业与个人创作者无需拍摄剪辑,就能快速生成多语言、高质量的专业视频。

即梦AI

即梦AI

一站式AI创作平台

提供 AI 驱动的图片、视频生成及数字人等功能,助力创意创作

下拉加载更多