介绍AgentScheduler,一个A1111/Vladmandic Stable Diffusion Web UI扩展,用于增强你的图像生成工作流程!
AgentScheduler的这个版本与以下最新版本兼容:
旧版本可能无法正常工作。
该扩展已包含在Vlad分支的内置扩展中。
git clone "https://github.com/ArtVentureX/sd-webui-agent-scheduler.git" extensions/agent-scheduler
(第二个参数指定文件夹名称,你可以选择任何你喜欢的名称)。
1️⃣ 输入你常用的提示词和设置。入队将你当前的提示词、设置、控制网络发送到AgentScheduler。
2️⃣ AgentScheduler扩展标签页。
3️⃣ 查看所有排队任务、当前正在生成的图像和任务的相关信息。拖放每行开头的手柄来重新安排生成顺序。
4️⃣ 暂停停止队列自动生成。恢复开始生成。
5️⃣ 按▶️优先处理选定任务,或在队列暂停时启动单个任务。删除你不再需要的任务。
6️⃣ 显示队列历史记录。
7️⃣ 筛选任务状态或按文本搜索。
8️⃣ 收藏任务以便更容易筛选。
9️⃣ 双击任务ID以重命名并快速更新基本参数。点击↩️重新入队旧任务。
🔟 点击每个任务查看生成结果。
右键点击入队
按钮并选择使用所有检查点排队
可以快速将当前设置与所有可用检查点一起排队。
启用自定义检查点选择(见下面的扩展设置部分),你可以选择一个文件夹(或子文件夹)来使用其中的所有检查点排队任务。例如:选择anime
将排队anime\AOM3A1B_oragemixs
、anime\counterfeit\Counterfeit-V2.5_fp16
和anime\counterfeit\Counterfeit-V2.5_pruned
。
双击排队任务进行编辑。你可以通过更改task_id
来命名任务,或更新一些基本参数:prompt
、negative prompt
、sampler
、checkpoint
、steps
、cfg scale
。
转到设置 > Agent调度器
访问扩展设置。
禁用队列自动处理:选中此选项可在启动时禁用队列自动处理。你也可以从扩展标签页暂时暂停或恢复队列。
队列按钮位置:更改UI上队列按钮的位置。
隐藏检查点下拉菜单:扩展提供了一个自定义检查点下拉菜单。
默认情况下,排队任务使用当前加载的检查点。但是,更改系统检查点需要一些时间将检查点加载到内存中,而且你也不能在图像生成过程中更改检查点。你可以使用此下拉菜单快速将任务排队使用自定义检查点。
自动删除队列历史:选择保留队列历史记录的时间段。早于配置值的任务将被自动删除。请注意,收藏的任务不会被删除。
可以通过HTTP API访问此扩展的所有功能。你可以通过http://127.0.0.1:7860/docs
访问API文档。记得在启动参数中包含--api
。
两个API /agent-scheduler/v1/queue/txt2img
和/agent-scheduler/v1/queue/img2img
支持原始webui API的所有参数。这些API返回任务ID,可用于稍后执行更新。
{ "task_id": "string" }
使用API /agent-scheduler/v1/results/{id}
获取生成的图像。API支持两种响应格式:
{ "success": true, "data": [ { "image": "data:image/png;base64,iVBORw0KGgoAAAAN...", "infotext": "1girl\nNegative prompt: EasyNegative, badhandv4..." }, { "image": "data:image/png;base64,iVBORw0KGgoAAAAN...", "infotext": "1girl\nNegative prompt: EasyNegative, badhandv4..." } ] }
zip=true
的zip文件使用参数callback_url
排队任务以注册API回调。例如:
{ "prompt": "1girl", "negative_prompt": "easynegative", "callback_url": "http://somehost:port/task_completed" }
回调端点必须支持POST
方法,正文使用multipart/form-data
编码。正文格式:
{ "task_id": "abc123", "status": "done", "files": [图像文件列表], }
使用FastApi
处理端点的示例代码:
from fastapi import FastAPI, UploadFile, File, Form @app.post("/task_completed") async def handle_task_completed( task_id: Annotated[str, Form()], status: Annotated[str, Form()], files: Optional[List[UploadFile]] = File(None), ): print(f"收到 {len(files)} 个文件,任务 {task_id} 状态 {status}") for file in files: print(f"* {file.filename} {file.content_type} {file.size}") # ... 对文件内容进行操作 ... # 收到 1 个文件,任务 3cf8b150-f260-4489-b6e8-d86ed8a564ca 状态 done # * 00008-3322209480.png image/png 416400
确保你运行的是最新版本的扩展和更新版本的WebUI。
git pull origin master
。尝试找出问题原因的步骤:
常见错误:
AttributeError: module 'modules.script_callbacks' has no attribute 'on_before_reload'
如果在输出控制台中看到此错误消息,请尝试将WebUI更新到最新版本。
更新:扩展已更新为打印此警告消息:您的SD WEBUI已过时,AGENT SCHEDULER将无法正常工作。 您仍然可以使用该扩展,但在重新加载后它将无法正常工作。
ReferenceError: submit_enqueue is not defined
如果点击"入队"按钮后没有反应,并且在浏览器F12控制台中发现上述错误消息,请按照此评论中的步骤操作。
更新:此问题现已修复。
TypeError: issubclass() arg 1 must be a class 请更新扩展,可能已经修复。
TypeError: Object of type X is not JSON serializable 请更新扩展,应该已经修复。如果没有,请提交 一个问题报告,并附上已安装扩展的列表。
对于其他错误,请随时提交新的Github问题。
列出此扩展可能的功能升级
我们欢迎对Agent Scheduler扩展项目的贡献!请随时通过GitHub仓库提交问题、错误报告和功能请求。
如果您觉得这个扩展有帮助,请给我们一个⭐!
本项目采用Apache License 2.0许可。
本项目的作者不对使用此软件造成的任何损害或法律问题负责。用户在使用此软件时需自行确保遵守任何适用的法律和法规,并承担与使用相关的所有风险。作者不对使用输入或输出内容引起的任何版权侵犯或法律问题负责。
ArtVenture为生成式AI图像工作流程提供强大的协作功能。它旨在帮助各级设计师和创意专业人士更高效地协作,释放创造力,并对创作过程实现完全的透明度和跟踪。
ArtVenture提供以下主要功能:
ArtVenture面向以下目标受众:
我们希望您觉得这个扩展有用。随着我们不断完善这个扩展以支持我们的创意工作流程,我们将随时添加新功能和改进。
要及时了解最新消息和更新,请务必在GitHub和Twitter(即将推出™️)上关注我们。我们欢迎您的反馈和建议,也很期待听到AgentScheduler如何帮助您简化工作流程并释放创造力!
一款强大的视觉语言模型,支持图像和视频输入
Qwen2.5-VL 是一款强大的视觉语言模型,支持图像和视频输入,可用于多种场景,如商品特点总结、图像文字识别等。项目提供了 OpenAI API 服务、Web UI 示例等部署方式,还包含了视觉处理工具,有助于开发者快速集成和使用,提升工作效率。
HunyuanVideo 是一个可基于文本生成高质量图像和视频的项目。
HunyuanVideo 是一个专注于文本到图像及视频生成的项目。它具备强大的视频生成能力,支持多种分辨率和视频长度选择,能根据用户输入的文本生成逼真的图像和视频。使用先进的技术架构和算法,可灵活调整生成参数,满足不同场景的需求,是文本生成图像视频领域的优质工具。
一个基于 Gradio 构建的 WebUI,支持与浏览器智能体进行便捷交互。
WebUI for Browser Use 是一个强大的项目,它集成了多种大型语言模型,支持自定义浏览器使用,具备持久化浏览器会话等功能。用户可以通过简洁友好的界面轻松控制浏览器智能体完 成各类任务,无论是数据提取、网页导航还是表单填写等操作都能高效实现,有利于提高工作效率和获取信息的便捷性。该项目适合开发者、研究人员以及需要自动化浏览器操作的人群使用,在 SEO 优化方面,其关键词涵盖浏览器使用、WebUI、大型语言模型集成等,有助于提高网页在搜索引擎中的曝光度。
基于 ESP32 的小智 AI 开发项目,支持多种网络连接与协议,实现语音交互等功能。
xiaozhi-esp32 是一个极具创新性的基于 ESP32 的开发项目,专注于人工智能语音交互领域。项目涵盖了丰富的功能,如网络连接、OTA 升级、设备激活等,同时支持多种语言。无论是开发爱好者还是专业开发者,都能借助该项目快速搭建起高效的 AI 语音交互系统,为智能设备开发提供强大助力。
一个用于 OCR 的项目,支持多种模型和服务器进行 PDF 到 Markdown 的转换,并提供测试和报告功能。
olmocr 是一个专注于光学字符识别(OCR)的 Python 项目,由 Allen Institute for Artificial Intelligence 开发。它支持多种模型和服务器,如 vllm、sglang、OpenAI 等,可将 PDF 文件的页面转换为 Markdown 格式。项目还提供了测试框架和 HTML 报告生成功能,方便用户对 OCR 结果进行评估和分析。适用于科研、文档处理等领域,有助于提高工作效率和准确性。
飞书多维表格 ×DeepSeek R1 满血版
飞书多维表格联合 DeepSeek R1 模型,提供 AI 自动化解决方案,支持批量写作、数据分析、跨模态处理等功能,适用于电商、短视频、影视创作等场景,提升企业生产力与创作效率。关键词:飞书多维表格、DeepSeek R1、AI 自动化、批量处理、企业协同工具。
高质量语音生成模型
CSM 是一个开源的语音生成项目,它提供了一个基于 Llama-3.2-1B 和 CSM-1B 的语音生成模型。该项目支持多语言,可生成多种声音,适用于研究和教育场景。通过使用 CSM,用户可以方便地进行语音合成,同时项目还提供了水印功能,确保生成音频的可追溯性和透明度。
Hugging Face 的 AI 智能体课程,涵盖多种智能体框架及相关知识
本项目是 Hugging Face 推出的 AI 智能体课程,深入介绍了 AI 智能体的相关概念,如大语言模型、工具使用等。课程包含多个单元,详细讲解了不同的智能体框架,如 smolagents 和 LlamaIndex,提供了丰富的学习资源和实践案例。适合对 AI 智能体感兴趣的开发者和学习者,有助于提升他们在该领域的知识和技能。
用于 AI 项目管理和 API 交互的工具集,助力 AI 项目高效开发与管理。
RagaAI-Catalyst 是一款专注于 AI 领域的强大工具集,为开发者提供了便捷的项目管理、API 交互、令牌管理等功能。支持多 API 密钥上传,能快速创建、列出和管理 AI 项目,还可获取项目用例和指标信息。适用于各类 AI 开发场景,提升开发效率,推动 AI 项目顺利开展。
一个包含多种工具和文档处理功能,适用于 LLM 使用的项目。
smolagents 是一个功能丰富的项目,提供了如文件格式转换、网页内容读取、语义搜索等多种工具,支持将常见文件类型或网页转换为 Markdown,方便进行文档处理和信息提取,能满足不同场景下的需求,提升工作效率和数据处理能力。
最新AI工具、AI资讯
独家AI资源、AI项目落地
微信扫一扫关注公众号