这个代码库包含了半监督语义分割领域中FixMatch的一个强大重新实现,以及我们的UniMatch在**自然场景、遥感和医学场景**中的官方PyTorch实现。
重新审视半监督语义分割中的弱到强一致性</br> Lihe Yang, Lei Qi, Litong Feng, Wayne Zhang, Yinghuan Shi</br> 发表于2023年计算机视觉与模式识别会议(CVPR)
我们提供了一个半监督语义分割优秀工作列表。
<p align="left"> <img src="https://yellow-cdn.veclightyear.com/835a84d5/c7236218-b1e8-40fc-b10e-5a251c14c5d5.png" width=90% height=90% class="center"> </p>您可以查看我们的训练日志,以便在复现时进行方便的比较。
注意:我们在最终版本中添加并更新了一些结果。请参阅我们的最新版本。
标注图像从原始高质量训练集中采样。结果基于ResNet-101的DeepLabv3+,训练尺寸为321。
| 方法 | 1/16 (92) | 1/8 (183) | 1/4 (366) | 1/2 (732) | 全部 (1464) |
|---|---|---|---|---|---|
| SupBaseline | 45.1 | 55.3 | 64.8 | 69.7 | 73.5 |
| U<sup>2</sup>PL | 68.0 | 69.2 | 73.7 | 76.2 | 79.5 |
| ST++ | 65.2 | 71.0 | 74.6 | 77.3 | 79.1 |
| PS-MT | 65.8 | 69.6 | 76.6 | 78.4 | 80.0 |
| UniMatch (我们的方法) | 75.2 | 77.2 | 78.8 | 79.9 | 81.2 |
结果基于ResNet-50/101的DeepLabv3+。我们在ResNet-50上重现了U<sup>2</sup>PL的结果。
注意:这些结果与我们的arXiv-V1版本不同,因为我们将置信度阈值从0.95改为0,并将ResNet的输出步幅从8改为16。因此,目前运行效率更高。
您可以点击数字直接跳转到相应的检查点。
| ResNet-50 | 1/16 | 1/8 | 1/4 | 1/2 | ResNet-101 | 1/16 | 1/8 | 1/4 | 1/2 |
|---|---|---|---|---|---|---|---|---|---|
| SupBaseline | 63.3 | 70.2 | 73.1 | 76.6 | SupBaseline | 66.3 | 72.8 | 75.0 | 78.0 |
| U<sup>2</sup>PL | 70.6 | 73.0 | 76.3 | 77.2 | U<sup>2</sup>PL | 74.9 | 76.5 | 78.5 | 79.1 |
| UniMatch (我们的方法) | 75.0 | 76.8 | 77.5 | 78.6 | UniMatch (我们的方法) | 76.6 | 77.9 | 79.2 | 79.5 |
结果基于Xception-65的DeepLabv3+。
您可以点击数字直接跳转到相应的检查点。
| 方法 | 1/512 (232) | 1/256 (463) | 1/128 (925) | 1/64 (1849) | 1/32 (3697) |
|---|---|---|---|---|---|
| SupBaseline | 22.9 | 28.0 | 33.6 | 37.8 | 42.2 |
| PseudoSeg | 29.8 | 37.1 | 39.1 | 41.8 | 43.6 |
| PC<sup>2</sup>Seg | 29.9 | 37.5 | 40.1 | 43.7 | 46.1 |
| UniMatch (我们的方法) | 31.9 | 38.9 | 44.4 | 48.2 | 49.8 |
我们还将UniMatch应用于半监督遥感变化检测和医学图像分割场景,相比之前的方法取得了巨大的改进:
cd UniMatch conda create -n unimatch python=3.10.4 conda activate unimatch pip install -r requirements.txt pip install torch==1.12.1+cu113 torchvision==0.13.1+cu113 -f https://download.pytorch.org/whl/torch_stable.html
ResNet-50 | ResNet-101 | Xception-65
├── ./pretrained
├── resnet50.pth
├── resnet101.pth
└── xception.pth
请在配置文件中修改您的数据集路径。
真实标签掩码已经由我们预处理过。您可以直接使用它们。
├── [您的Pascal路径]
├── JPEGImages
└── SegmentationClass
├── [您的Cityscapes路径]
├── leftImg8bit
└── gtFine
├── [您的COCO路径]
├── train2017
├── val2017
└── masks
# 使用torch.distributed.launch sh scripts/train.sh <num_gpu> <port> # 要完全复现我们的结果,<num_gpu>应该在所有三个数据集上设置为4 # 否则,您需要相应地调整学习率 # 或使用slurm # sh scripts/slurm_train.sh <num_gpu> <port> <partition>
要在其他数据集或分割上进行训练,请修改train.sh中的dataset和split。
在train.sh中将method从'unimatch'修改为'fixmatch'。
在train.sh中将method从'unimatch'修改为'supervised',如果您使用与半监督设置相同数量的GPU,请将配置文件中的batch_size加倍(无需更改lr)。
如果您觉得这个项目有用,请考虑引用:
@inproceedings{unimatch, title={Revisiting Weak-to-Strong Consistency in Semi-Supervised Semantic Segmentation}, author={Yang, Lihe and Qi, Lei and Feng, Litong and Zhang, Wayne and Shi, Yinghuan}, booktitle={CVPR}, year={2023} }
我们还有一些 其他关于半监督语义分割的工作:


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。


AI论文写作指导平台
AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。


AI一键生成PPT,就用博思AIPPT!
博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。


AI赋能电商视觉革命,一站式智能商拍平台
潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。


企业专属的AI法律顾问
iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。


稳定高效的流量提升解决方案,助力品牌曝光
稳定高效的流量提升解决方案,助力品牌曝光


最新版Sora2模型免费使用,一键生成无水印视频
最新版Sora2模型免费使用,一键生成无水印视频
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号