DIS

DIS

高精度二值图像分割方法,优化模型与即将发布的V2.0数据集

简要介绍高精度二值图像分割(DIS)任务的新进展,包括ECCV 2022接受的论文、DIS5K数据集V1.0和即将发布的V2.0版本。DIS任务应用于3D建模、图像编辑、艺术设计、静态图像动画和增强现实等领域。目前发布的为学术版本模型,用户可通过链接下载预训练权重进行推理。优化模型和更全面的数据集即将发布,敬请关注。

Dichotomous Image SegmentationECCV 2022IS-NetDIS datasetU2-NetGithub开源项目
<p align="center"> <img width="420" height="320" src="https://yellow-cdn.veclightyear.com/35dd4d3f/f95a193b-0a66-4733-b778-87e1c59c1e0a.png"> </p>

dis5k-v1-sailship

<br>

高精度二分图像分割(ECCV 2022)

Xuebin Qin, Hang Dai, Xiaobin Hu, Deng-Ping Fan*, Ling Shao, Luc Van Gool.

<br>

这是我们新制定的DIS任务的官方仓库:

项目页面, Arxiv, 中文.

<br>

当前,此仓库中仅包含我们DIS V2.0数据集的一些示例图像。完整的DIS V2.0数据集和模型尚未发布!(快速响应有关DIS V2.0的许多电子邮件。)

我们正在尽最大努力尽早发布!

disv2-peacock

更新!!!

(2022年8月17日) 现在已发布我们IS-Net用于通用优化模型:isnet-general-use.pth(用于通用,这不是DIS V2.0)从 (Google Drive)(百度云 提取码:6jh2),请随时尝试在您自己的数据集上使用新创建的简单inference.py代码。 u2net-isnet-cmp

(2022年7月30日) 感谢 AK391 实现了Web Demo:集成到Huggingface Spaces 🤗中,使用Gradio。试用Web Demo Hugging Face Spaces<br>

官方DIS小组注意事项:当前发布的DIS深度模型是学术版本,使用了DIS V1.0训练,涵盖极少量的动物、人类、汽车等。因此在这些目标上可能表现不佳。我们将发布另一个版本用于通用测试。此外,我们的DIS V2.0将涵盖更多类别,样本注释极为精细。请持续关注。<br>

(2022年7月17日) 我们的论文、代码和数据集现已正式发布!!!详情请查看我们的项目页面:项目页面<br>

(2022年7月5日) 我们的DIS工作现已被ECCV 2022接受,代码和数据集将在2022年7月17日之前发布。请关注我们的更新。

<br>

1. 我们的二分类图像分割(DIS)数据集

1.1 DIS数据集V1.0:DIS5K

<br>

下载: Google Drive百度云 提取码:rtgw

dis5k-dataset-v1-sailship complexities-qual categories

1.2 DIS 数据集V2.0

<br>

虽然我们的DIS5K V1.0 包含200多个类别的样本,但现实世界中许多类别,如人类、动物、汽车等,并未包括在内。因此,我们的数据集当前版本(v1.0)可能会限制训练模型的鲁棒性。为了构建全面且大规模的高精度二分类图像分割数据集,我们正在构建DIS数据集V2.0。V2.0将很快发布。请持续关注。

DIS数据集V2.0的样本。 dis-v2

<br>

2. 我们DIS5K数据集的应用

<br>

3D建模

3d-modeling

图像编辑

ship-demo

艺术设计材料

bg-removal

静态图像动画

view-move

AR

motor-demo

3D 渲染

video-3d

<br>

3. 我们的IS-Net架构

<br>

is-net

<br>

4. 人类纠正工作量(HCE)

<br>

hce-metric

<br>

5. 实验结果

<br>

我们的IS-Net和其他SOTA的预测图,Google Drive百度云 提取码:ph1d

质性对比 SOTA (最新科技)

质性对比

定量对比 SOTA (最新科技)

定量对比

<br>

6. 运行我们的代码

<br>

(1) 克隆这个代码库

git clone https://github.com/xuebinqin/DIS.git

(2) 配置环境: 进入 DIS/ISNet 目录并运行

conda env create -f pytorch18.yml

或者你可以查看 requirements.txt 来配置依赖。

(3) 激活 conda 环境

conda activate pytorch18

(4) 训练:

(a) 打开 train_valid_inference_main.py, 设置你需推理的 train_datasetsvalid_datasets 的路径,例如 valid_datasets=[dataset_vd] <br> (b) 设置 hypar["mode"]"train" <br> (c) 在目录 saved_models 中创建一个新文件夹 your_model_weights,并将其设置为 hypar["model_path"] ="../saved_models/your_model_weights",并确保 hypar["valid_out_dir"](在 668 行)设置为空,否则验证阶段的预测图将被保存到该目录,这将减慢训练速度 <br> (d) 运行

python train_valid_inference_main.py

(5) 推理

下载预训练权重(用于公平的学术对比)isnet.pthGoogle DriveBaidu Pan 提取码:xbfk 或 优化模型权重 isnet-general-use.pth (用于通用) 从 Google DriveBaidu Pan 提取码:6jh2,并存储在 saved_models/IS-Net 目录 <br>

I. 对自己没有标注数据集的简单推理代码:

(a) 打开 \ISNet\inference.py 并配置你的输入和输出目录 (b) 运行

python inference.py

II. 对有/无标注数据集的推理

(a) 打开 train_valid_inference_main.py,设置你需推理的 valid_datasets 路径,例如 valid_datasets=[dataset_te1, dataset_te2, dataset_te3, dataset_te4] <br> (b) 设置 hypar["mode"]"valid" <br> (c) 设置预测图的输出目录,例如 hypar["valid_out_dir"] = "../DIS5K-Results-test" <br> (d) 运行

python train_valid_inference_main.py

(6) 使用我们的 HCE 人工校正评估指标

设置 ground truth 目录 gt_root 和预测目录 pred_root。为了减少计算 HCE 的时间成本,可以预计算并存储 DIS5K 数据集的骨架图于 gt_ske_root 目录。如果 gt_ske_root="", HCE 代码将在线计算骨架,这通常会花费很长时间。然后,运行 python hce_metric_main.py。其他指标基于 SOCToolbox 进行评估。

<br>

7. 使用条款

我们的代码和评估指标使用 Apache 许可 2.0。DIS5K 数据集的使用条款请参阅 DIS5K-Dataset-Terms-of-Use.pdf

<br>

致谢

<br>

我们要感谢 Ibrahim Almakky 博士 在实现加载大尺寸训练样本的数据加载器缓存机制方面的帮助,以及 Jiayi Zhu 在重新组织我们的代码和数据集方面的努力。

<br>

引用

<br>
@InProceedings{qin2022,
      author={Xuebin Qin and Hang Dai and Xiaobin Hu and Deng-Ping Fan and Ling Shao and Luc Van Gool},
      title={Highly Accurate Dichotomous Image Segmentation},
      booktitle={ECCV},
      year={2022}
}
<br>

我们之前的工作: U<sup>2</sup>-Net, BASNet.

<br>

@InProceedings{Qin_2020_PR,
      title = {U2-Net: Going Deeper with Nested U-Structure for Salient Object Detection},
      author = {Qin, Xuebin and Zhang, Zichen and Huang, Chenyang and Dehghan, Masood and Zaiane, Osmar and Jagersand, Martin},
      journal = {Pattern Recognition},
      volume = {106},
      pages = {107404},
      year = {2020}
}

@InProceedings{Qin_2019_CVPR,
        author = {Qin, Xuebin and Zhang, Zichen and Huang, Chenyang and Gao, Chao and Dehghan, Masood and Jagersand, Martin},
        title = {BASNet: Boundary-Aware Salient Object Detection},
        booktitle = {The IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
        month = {June},
        year = {2019}
}

@article{qin2021boundary,
       title={Boundary-aware segmentation network for mobile and web applications},
       author={Qin, Xuebin and Fan, Deng-Ping and Huang, Chenyang and Diagne, Cyril and Zhang, Zichen and Sant'Anna, Adri{\`a} Cabeza and Suarez, Albert and Jagersand, Martin and Shao, Ling},
       journal={arXiv preprint arXiv:2101.04704},
       year={2021}
}

编辑推荐精选

Vora

Vora

免费创建高清无水印Sora视频

Vora是一个免费创建高清无水印Sora视频的AI工具

Refly.AI

Refly.AI

最适合小白的AI自动化工作流平台

无需编码,轻松生成可复用、可变现的AI自动化工作流

酷表ChatExcel

酷表ChatExcel

大模型驱动的Excel数据处理工具

基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。

AI工具酷表ChatExcelAI智能客服AI营销产品使用教程
TRAE编程

TRAE编程

AI辅助编程,代码自动修复

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
AIWritePaper论文写作

AIWritePaper论文写作

AI论文写作指导平台

AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。

AI辅助写作AI工具AI论文工具论文写作智能生成大纲数据安全AI助手热门
博思AIPPT

博思AIPPT

AI一键生成PPT,就用博思AIPPT!

博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。

AI办公办公工具AI工具博思AIPPTAI生成PPT智能排版海量精品模板AI创作热门
潮际好麦

潮际好麦

AI赋能电商视觉革命,一站式智能商拍平台

潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。

iTerms

iTerms

企业专属的AI法律顾问

iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。

SimilarWeb流量提升

SimilarWeb流量提升

稳定高效的流量提升解决方案,助力品牌曝光

稳定高效的流量提升解决方案,助力品牌曝光

Sora2视频免费生成

Sora2视频免费生成

最新版Sora2模型免费使用,一键生成无水印视频

最新版Sora2模型免费使用,一键生成无水印视频

下拉加载更多