sd-webui-agent-scheduler

sd-webui-agent-scheduler

Stable Diffusion图像生成工作流管理插件

AgentScheduler是一款为Stable Diffusion Web UI设计的扩展插件,用于优化图像生成工作流。它具备任务队列管理、参数编辑、多检查点批量生成等功能,并支持API访问和回调。该插件兼容A1111和Vladmandic最新版本,安装使用便捷,可有效提升AI图像生成效率。

AgentSchedulerStable Diffusion图像生成工作流WebUI扩展Github开源项目

Agent调度器

介绍AgentScheduler,一个A1111/Vladmandic Stable Diffusion Web UI扩展,用于增强你的图像生成工作流程!

目录


兼容性

AgentScheduler的这个版本与以下最新版本兼容:

旧版本可能无法正常工作。

安装

使用Vlad的WebUI分支

该扩展已包含在Vlad分支的内置扩展中。

使用内置扩展列表

  1. 打开扩展标签页
  2. 打开"从URL安装"子标签页
  3. 粘贴仓库链接: https://github.com/ArtVentureX/sd-webui-agent-scheduler.git
  4. 点击"安装"

安装

手动克隆

git clone "https://github.com/ArtVentureX/sd-webui-agent-scheduler.git" extensions/agent-scheduler

(第二个参数指定文件夹名称,你可以选择任何你喜欢的名称)。

基本功能

扩展演示1

1️⃣ 输入你常用的提示词和设置。入队将你当前的提示词、设置、控制网络发送到AgentScheduler

扩展演示2

2️⃣ AgentScheduler扩展标签页。

3️⃣ 查看所有排队任务、当前正在生成的图像和任务的相关信息。拖放每行开头的手柄来重新安排生成顺序。

4️⃣ 暂停停止队列自动生成。恢复开始生成。

5️⃣ 按▶️优先处理选定任务,或在队列暂停时启动单个任务。删除你不再需要的任务。

扩展演示3

6️⃣ 显示队列历史记录。

7️⃣ 筛选任务状态或按文本搜索。

8️⃣ 收藏任务以便更容易筛选。

9️⃣ 双击任务ID以重命名并快速更新基本参数。点击↩️重新入队旧任务。

🔟 点击每个任务查看生成结果。

https://github.com/ArtVentureX/sd-webui-agent-scheduler/assets/133728487/50c74922-b85f-493c-9be8-b8e78f0cd061

隐藏功能:

同时将所有检查点排队

右键点击入队按钮并选择使用所有检查点排队可以快速将当前设置与所有可用检查点一起排队。

图片

使用部分检查点排队

图片

图片

启用自定义检查点选择(见下面的扩展设置部分),你可以选择一个文件夹(或子文件夹)来使用其中的所有检查点排队任务。例如:选择anime将排队anime\AOM3A1B_oragemixsanime\counterfeit\Counterfeit-V2.5_fp16anime\counterfeit\Counterfeit-V2.5_pruned

编辑排队任务

双击排队任务进行编辑。你可以通过更改task_id来命名任务,或更新一些基本参数:promptnegative promptsamplercheckpointstepscfg scale

图片

扩展设置

转到设置 > Agent调度器访问扩展设置。

设置

禁用队列自动处理:选中此选项可在启动时禁用队列自动处理。你也可以从扩展标签页暂时暂停或恢复队列。

队列按钮位置:更改UI上队列按钮的位置。

隐藏检查点下拉菜单:扩展提供了一个自定义检查点下拉菜单。

自定义检查点

默认情况下,排队任务使用当前加载的检查点。但是,更改系统检查点需要一些时间将检查点加载到内存中,而且你也不能在图像生成过程中更改检查点。你可以使用此下拉菜单快速将任务排队使用自定义检查点。

自动删除队列历史:选择保留队列历史记录的时间段。早于配置值的任务将被自动删除。请注意,收藏的任务不会被删除。

API访问

可以通过HTTP API访问此扩展的所有功能。你可以通过http://127.0.0.1:7860/docs访问API文档。记得在启动参数中包含--api

API文档

队列任务

两个API /agent-scheduler/v1/queue/txt2img/agent-scheduler/v1/queue/img2img支持原始webui API的所有参数。这些API返回任务ID,可用于稍后执行更新。

{ "task_id": "string" }

下载结果

使用API /agent-scheduler/v1/results/{id}获取生成的图像。API支持两种响应格式:

  • json格式,base64编码
{ "success": true, "data": [ { "image": "data:image/png;base64,iVBORw0KGgoAAAAN...", "infotext": "1girl\nNegative prompt: EasyNegative, badhandv4..." }, { "image": "data:image/png;base64,iVBORw0KGgoAAAAN...", "infotext": "1girl\nNegative prompt: EasyNegative, badhandv4..." } ] }
  • 带查询字符串zip=true的zip文件

API回调

使用参数callback_url排队任务以注册API回调。例如:

{ "prompt": "1girl", "negative_prompt": "easynegative", "callback_url": "http://somehost:port/task_completed" }

回调端点必须支持POST方法,正文使用multipart/form-data编码。正文格式:

{ "task_id": "abc123", "status": "done", "files": [图像文件列表], }

使用FastApi处理端点的示例代码:

from fastapi import FastAPI, UploadFile, File, Form @app.post("/task_completed") async def handle_task_completed( task_id: Annotated[str, Form()], status: Annotated[str, Form()], files: Optional[List[UploadFile]] = File(None), ): print(f"收到 {len(files)} 个文件,任务 {task_id} 状态 {status}") for file in files: print(f"* {file.filename} {file.content_type} {file.size}") # ... 对文件内容进行操作 ... # 收到 1 个文件,任务 3cf8b150-f260-4489-b6e8-d86ed8a564ca 状态 done # * 00008-3322209480.png image/png 416400

故障排除

确保你运行的是最新版本的扩展和更新版本的WebUI。

  • 要更新扩展,请转到"扩展"选项卡,点击"检查更新",然后点击"应用并重启界面"。
  • 要更新WebUI本身,请在与webui.bat(或webui.sh)相同的文件夹中运行命令 git pull origin master

尝试找出问题原因的步骤:

  • 检查WebUI输出控制台是否有错误。
  • 在浏览器中按F12,然后转到控制台选项卡并重新加载页面,在此处查找任何错误消息。

常见错误:

AttributeError: module 'modules.script_callbacks' has no attribute 'on_before_reload'

如果在输出控制台中看到此错误消息,请尝试将WebUI更新到最新版本。

更新:扩展已更新为打印此警告消息:您的SD WEBUI已过时,AGENT SCHEDULER将无法正常工作。 您仍然可以使用该扩展,但在重新加载后它将无法正常工作。

ReferenceError: submit_enqueue is not defined

如果点击"入队"按钮后没有反应,并且在浏览器F12控制台中发现上述错误消息,请按照此评论中的步骤操作。

更新:此问题现已修复。

TypeError: issubclass() arg 1 must be a class 请更新扩展,可能已经修复。

TypeError: Object of type X is not JSON serializable 请更新扩展,应该已经修复。如果没有,请提交一个问题报告,并附上已安装扩展的列表。

对于其他错误,请随时提交新的Github问题

路线图

列出此扩展可能的功能升级

  • 连接多个SD webui节点以运行任务。
  • 与GenAI管理平台ArtVenture同步

贡献

我们欢迎对Agent Scheduler扩展项目的贡献!请随时通过GitHub仓库提交问题、错误报告和功能请求。

如果您觉得这个扩展有帮助,请给我们一个⭐!

许可证

本项目采用Apache License 2.0许可。

免责声明

本项目的作者不对使用此软件造成的任何损害或法律问题负责。用户在使用此软件时需自行确保遵守任何适用的法律和法规,并承担与使用相关的所有风险。作者不对使用输入或输出内容引起的任何版权侵犯或法律问题负责。


由构建ARTVENTUREATHERLABSSIPHER ODYSSEY的团队精心打造

关于ArtVenture(即将推出™️)

ArtVenture为生成式AI图像工作流程提供强大的协作功能。它旨在帮助各级设计师和创意专业人士更高效地协作,释放创造力,并对创作过程实现完全的透明度和跟踪。

ArtVenture预告

ArtVenture预告2

当前功能

ArtVenture提供以下主要功能:

  • 无缝访问:可在桌面和移动设备上使用
  • 多人协作和协作式用户体验。强大的协作功能,如实时评论和反馈、版本控制以及图像/文件/项目共享。
  • 强大的语义搜索功能。
  • 站在巨人的肩膀上,利用A1111/Vladnmandic和其他先驱者的成果,在一个平台上提供从创意(草图/想法/业务需求)到最终结果(图像/文案发布/任务完成)的协作流程
  • 某些重复任务的自动化工具
  • 安全透明,利用哈希和元数据追踪模型、loras、图像的来源和历史,实现可追溯性和便于协作。
  • 为初学者和有经验的用户提供个性化的用户体验,通过编辑提示和负面提示、选择新的训练模型和所需的输出质量,快速重新组合现有的SD图像。

目标受众

ArtVenture面向以下目标受众:

  • 休闲创作者
  • 小型设计团队或自由职业者
  • 设计机构和工作室

🎉 敬请期待更新

我们希望您觉得这个扩展有用。随着我们不断完善这个扩展以支持我们的创意工作流程,我们将随时添加新功能和改进。

要及时了解最新消息和更新,请务必在GitHub和Twitter(即将推出™️)上关注我们。我们欢迎您的反馈和建议,也很期待听到AgentScheduler如何帮助您简化工作流程并释放创造力!

编辑推荐精选

Qwen2.5-VL

Qwen2.5-VL

一款强大的视觉语言模型,支持图像和视频输入

Qwen2.5-VL 是一款强大的视觉语言模型,支持图像和视频输入,可用于多种场景,如商品特点总结、图像文字识别等。项目提供了 OpenAI API 服务、Web UI 示例等部署方式,还包含了视觉处理工具,有助于开发者快速集成和使用,提升工作效率。

HunyuanVideo

HunyuanVideo

HunyuanVideo 是一个可基于文本生成高质量图像和视频的项目。

HunyuanVideo 是一个专注于文本到图像及视频生成的项目。它具备强大的视频生成能力,支持多种分辨率和视频长度选择,能根据用户输入的文本生成逼真的图像和视频。使用先进的技术架构和算法,可灵活调整生成参数,满足不同场景的需求,是文本生成图像视频领域的优质工具。

WebUI for Browser Use

WebUI for Browser Use

一个基于 Gradio 构建的 WebUI,支持与浏览器智能体进行便捷交互。

WebUI for Browser Use 是一个强大的项目,它集成了多种大型语言模型,支持自定义浏览器使用,具备持久化浏览器会话等功能。用户可以通过简洁友好的界面轻松控制浏览器智能体完成各类任务,无论是数据提取、网页导航还是表单填写等操作都能高效实现,有利于提高工作效率和获取信息的便捷性。该项目适合开发者、研究人员以及需要自动化浏览器操作的人群使用,在 SEO 优化方面,其关键词涵盖浏览器使用、WebUI、大型语言模型集成等,有助于提高网页在搜索引擎中的曝光度。

xiaozhi-esp32

xiaozhi-esp32

基于 ESP32 的小智 AI 开发项目,支持多种网络连接与协议,实现语音交互等功能。

xiaozhi-esp32 是一个极具创新性的基于 ESP32 的开发项目,专注于人工智能语音交互领域。项目涵盖了丰富的功能,如网络连接、OTA 升级、设备激活等,同时支持多种语言。无论是开发爱好者还是专业开发者,都能借助该项目快速搭建起高效的 AI 语音交互系统,为智能设备开发提供强大助力。

olmocr

olmocr

一个用于 OCR 的项目,支持多种模型和服务器进行 PDF 到 Markdown 的转换,并提供测试和报告功能。

olmocr 是一个专注于光学字符识别(OCR)的 Python 项目,由 Allen Institute for Artificial Intelligence 开发。它支持多种模型和服务器,如 vllm、sglang、OpenAI 等,可将 PDF 文件的页面转换为 Markdown 格式。项目还提供了测试框架和 HTML 报告生成功能,方便用户对 OCR 结果进行评估和分析。适用于科研、文档处理等领域,有助于提高工作效率和准确性。

飞书多维表格

飞书多维表格

飞书多维表格 ×DeepSeek R1 满血版

飞书多维表格联合 DeepSeek R1 模型,提供 AI 自动化解决方案,支持批量写作、数据分析、跨模态处理等功能,适用于电商、短视频、影视创作等场景,提升企业生产力与创作效率。关键词:飞书多维表格、DeepSeek R1、AI 自动化、批量处理、企业协同工具。

CSM

CSM

高质量语音生成模型

CSM 是一个开源的语音生成项目,它提供了一个基于 Llama-3.2-1B 和 CSM-1B 的语音生成模型。该项目支持多语言,可生成多种声音,适用于研究和教育场景。通过使用 CSM,用户可以方便地进行语音合成,同时项目还提供了水印功能,确保生成音频的可追溯性和透明度。

agents-course

agents-course

Hugging Face 的 AI 智能体课程,涵盖多种智能体框架及相关知识

本项目是 Hugging Face 推出的 AI 智能体课程,深入介绍了 AI 智能体的相关概念,如大语言模型、工具使用等。课程包含多个单元,详细讲解了不同的智能体框架,如 smolagents 和 LlamaIndex,提供了丰富的学习资源和实践案例。适合对 AI 智能体感兴趣的开发者和学习者,有助于提升他们在该领域的知识和技能。

RagaAI-Catalyst

RagaAI-Catalyst

用于 AI 项目管理和 API 交互的工具集,助力 AI 项目高效开发与管理。

RagaAI-Catalyst 是一款专注于 AI 领域的强大工具集,为开发者提供了便捷的项目管理、API 交互、令牌管理等功能。支持多 API 密钥上传,能快速创建、列出和管理 AI 项目,还可获取项目用例和指标信息。适用于各类 AI 开发场景,提升开发效率,推动 AI 项目顺利开展。

smolagents

smolagents

一个包含多种工具和文档处理功能,适用于 LLM 使用的项目。

smolagents 是一个功能丰富的项目,提供了如文件格式转换、网页内容读取、语义搜索等多种工具,支持将常见文件类型或网页转换为 Markdown,方便进行文档处理和信息提取,能满足不同场景下的需求,提升工作效率和数据处理能力。

下拉加载更多