sd-webui-infinite-image-browsing

sd-webui-infinite-image-browsing

Stable Diffusion webui图像浏览与管理扩展

sd-webui-infinite-image-browsing是Stable Diffusion webui的扩展插件,提供高性能图像浏览和管理功能。支持ComfyUI、Fooocus等多种AI软件,具备图像搜索、收藏、全屏预览和文件操作等特性。该扩展还提供多语言支持、隐私保护和批量下载功能,适用于AI生成图像的管理和浏览。

Stable Diffusion图像浏览AI绘图扩展功能文件管理Github开源项目

🌍 i18n 提示:部分翻译可能不完整或不准确。欢迎提交 Pull Request 以改进翻译!

🌐 在线体验我们的应用:http://39.105.110.128:0721。这是我的闲置 2c2g3m 云服务器,未使用 CDN。

中文文档 更新日志 安装 / 运行

Stable Diffusion webui 无限图像浏览器

软件支持和开发进度概览

软件支持状态提供方式
Stable Diffusion web UI已支持内置
ComfyUI部分支持内置
Fooocus已支持内置
NovelAI已支持内置
StableSwarmUI已支持内置
Pixiv已支持pixiv_iib_plugin

如果您想支持更多软件,请参考:parserspixiv_iib_plugin

主要特性

🔥 出色的性能

  • 一旦生成缓存,图像可在几毫秒内显示。
  • 默认使用缩略图显示图像,默认大小为 512 像素。您可以在全局设置页面调整缩略图分辨率。
  • 您还可以控制网格图像的宽度,使其显示宽度范围从 64px 到 1024px。
  • 支持通过 --generate_video_cover--generate_image_cache 预生成缩略图和视频封面以提高性能。
  • 支持通过 IIB_CACHE_DIR 环境变量指定缓存目录。

🔍 图像搜索和收藏

  • 提示词、模型、Lora 等信息将转换为标签并按使用频率排序,以便精确搜索。
  • 支持标签自动完成、自动翻译和自定义。
  • 可通过右键菜单切换自定义标签来实现图像收藏。
  • 支持类似 Google 的高级搜索。
  • 也支持模糊搜索,您可以通过文件名或生成信息的一部分进行搜索。
  • 支持添加自定义搜索路径,便于管理用户创建的文件夹。

🖼️ 查看图像/视频和"发送到"功能

  • 支持查看图像生成信息。全屏预览模式下也支持此功能。
  • 支持将图像发送到其他标签页和第三方扩展,如 ControlNet、openOutpaint。
  • 支持全屏预览,并在全屏预览模式下启用自定义快捷键操作。
  • 支持在全屏预览模式下通过按箭头键或点击按钮导航到上一张或下一张图像。
  • 支持播放来自远程服务器的视频文件。

💻 多种使用方法

  • 您可以将其作为 SD-webui 的扩展安装。
  • 您可以使用 Python 独立运行它。
  • 也提供桌面应用版本。
  • 支持多种流行的 AI 软件。

🚶‍♀️ 漫游模式

  • 自动加载下一个文件夹(类似于 os.walk),让您无需分页即可浏览所有图像。
  • 经测试可正常处理超过 27,000 个文件。
  • 当有文件夹时,您可以通过点击右上角的漫游按钮从其他模式切换到漫游模式。它会扁平化所有文件夹,避免繁琐的进出文件夹操作。

🌳 基于文件树结构的预览和文件操作

  • 支持基于文件树的预览。
  • 支持自动刷新。
  • 支持基本文件操作,如多选删除/移动/复制和创建新文件夹。
  • 按住 Ctrl、Shift 或 Cmd 键可选择多个项目。
    • 支持的多选操作包括:删除、移动、复制、打包下载、添加标签、删除标签、移动到另一个文件夹、复制到另一个文件夹、拖放。
    • 您可以通过点击右下角的"保持多选"按钮保持多选状态,方便对所选文件集合执行多个操作。

🆚 图像对比(类似 Imgsli)

  • 提供两张图像的并排比较。
  • 同时提供图像生成信息的比较。

🌐 多语言支持

  • 目前支持简体中文/繁体中文/英语/德语。
  • 如果您想添加新语言,请参考 i18n.ts 并提交相关代码。

🔐 隐私和安全

  • 支持自定义密钥进行身份验证。
  • 支持配置文件系统的访问控制,当服务允许公开访问时默认启用(仅作为 sd-webui 的扩展使用时)。
  • 支持自定义访问控制的允许路径。
  • 支持控制访问权限。您可以在只读模式下运行 IIB。
  • 点击此处查看详情

📦 打包/批量下载

  • 允许一次下载多张图像。
  • 数据源可以是搜索结果、常规图像网格视图页面、漫游模式等。可以通过拖放或"发送到"将图像添加到处理列表。

⌨️ 键盘快捷键

  • 允许删除和添加/删除标签,可在全局设置页面自定义触发按钮。

如果您喜欢这个项目并觉得它有帮助,请考虑给它一个 ⭐️。这对我继续开发和维护这个项目非常重要。如果您有任何建议或想法,请随时在 issue 部分提出,我会尽快回复。再次感谢您的支持!

<a href='https://ko-fi.com/zanllp' target='_blank'><img height='35' style='border:0px;height:46px;' src='https://yellow-cdn.veclightyear.com/835a84d5/54f5c9af-4cf7-4941-8233-5d86cb306084.png?v=0' border='0' alt='在 ko-fi.com 上给我买杯咖啡' />

在微信上赞助我

安装 / 运行

作为 SD-webui 的扩展:

  1. 在 SD-webui 中打开"扩展"标签。
  2. 选择"从 URL 安装"选项。
  3. 输入 https://github.com/zanllp/sd-webui-infinite-image-browsing
  4. 点击"安装"按钮。
  5. 等待安装完成,然后点击"应用并重新启动 UI"。

作为独立程序使用 Python 运行(无需 SD-webui):

参考 扩展可以在没有 web UI 的情况下运行吗?

如果您需要查看由 ComfyUI/Fooocus/NovelAI 生成的图像,请参考 https://github.com/zanllp/sd-webui-infinite-image-browsing/issues/202

如果您需要 Dockerfile,可以参考此链接:https://github.com/zanllp/sd-webui-infinite-image-browsing/discussions/366

作为桌面应用程序(无需SD-webui和Python):

可执行版本也支持ComfyUI/Fooocus/NovelAI。

从存储库页面右侧的"releases"部分下载并安装程序。 如果杀毒软件检测到病毒,可以忽略,这是误报。

如果您需要自行编译,请参阅https://github.com/zanllp/sd-webui-infinite-image-browsing/blob/main/.github/workflows/tauri_app_build.yml。

作为库使用:

使用iframe访问IIB,将其用作应用程序的文件浏览器。参考https://github.com/zanllp/sd-webui-infinite-image-browsing/blob/main/vue/usage.md

预览

<img width="1920" alt="image" src="https://yellow-cdn.veclightyear.com/835a84d5/d97fa390-1b22-4792-8708-d16f7a0db346.png">

图像搜索

首次使用时,需要点击并等待索引生成。以我2万张图片为例,花了约45秒(使用AMD 5600X CPU和PCIe SSD)。之后使用时,会检查文件夹是否有变化,如有则需要重新生成索引。通常这个过程很快。

图像搜索支持翻译,详情见https://github.com/zanllp/sd-webui-infinite-image-browsing/issues/39。欢迎分享其他语言的文件,方便大家使用。 <img width="1109" alt="image" src="https://github.com/zanllp/sd-webui-infinite-image-browsing/assets/25872019/62d1ffe3-2d1f-4449-803a-970273753855"> <img width="620" alt="image" src="https://yellow-cdn.veclightyear.com/835a84d5/ef2157bf-2c3e-4673-9052-b266737daa21.png">

全屏预览(并排布局)

11

全屏预览

<img width="1024" alt="image" src="https://yellow-cdn.veclightyear.com/835a84d5/f908044a-6381-497c-8c06-581e4415b6fa.png">

在全屏预览模式下,您还可以查看图像信息并在上下文菜单中执行操作。支持拖动、调整大小和展开/折叠。

https://user-images.githubusercontent.com/25872019/235327735-bfb50ea7-7682-4e50-b303-38159456e527.mp4

如果您和我一样不需要查看生成信息,可以选择简单地最小化此面板,所有上下文操作仍然可用。

<img width="599" alt="image" src="https://github.com/zanllp/sd-webui-infinite-image-browsing/assets/25872019/f26abe8c-7a76-45c3-9d7f-18ae8b6b6a91">

图像对比

ezgif com-video-to-gif

在不同标签页面板之间传输文件

https://github.com/zanllp/sd-webui-infinite-image-browsing/assets/25872019/e631e3c3-1cbf-49bc-8577-f2963a6c9e4d

右键菜单

<img width="536" alt="image" src="https://yellow-cdn.veclightyear.com/835a84d5/46d3560c-98f8-424b-ac0d-d52eeccf8757.png">

您也可以通过将鼠标悬停在右上角的图标上来触发它。

<img width="227" alt="image" src="https://github.com/zanllp/sd-webui-infinite-image-browsing/assets/25872019/f2005ad3-2d3b-4fa7-b3e5-bc17f26f7e19">

漫步模式

https://user-images.githubusercontent.com/25872019/230768207-daab786b-d4ab-489f-ba6a-e9656bd530b8.mp4

暗黑模式

<img width="768" alt="image" src="https://yellow-cdn.veclightyear.com/835a84d5/154be8b1-0462-47fa-9d47-89e9e3b0e21a.png">

编辑推荐精选

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

热门AI工具生产力协作转型TraeAI IDE
问小白

问小白

全能AI智能助手,随时解答生活与工作的多样问题

问小白,由元石科技研发的AI智能助手,快速准确地解答各种生活和工作问题,包括但不限于搜索、规划和社交互动,帮助用户在日常生活中提高效率,轻松管理个人事务。

聊天机器人AI助手热门AI工具AI对话
Transly

Transly

实时语音翻译/同声传译工具

Transly是一个多场景的AI大语言模型驱动的同声传译、专业翻译助手,它拥有超精准的音频识别翻译能力,几乎零延迟的使用体验和支持多国语言可以让你带它走遍全球,无论你是留学生、商务人士、韩剧美剧爱好者,还是出国游玩、多国会议、跨国追星等等,都可以满足你所有需要同传的场景需求,线上线下通用,扫除语言障碍,让全世界的语言交流不再有国界。

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

热门AI工具AI办公办公工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

模型训练热门AI工具内容创作智能问答AI开发讯飞星火大模型多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

AI助手热门AI工具AI创作AI辅助写作讯飞绘文内容运营个性化文章多平台分发
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

下拉加载更多