欢迎加入COD社区! 我们创建了一个微信群,你可以通过添加联系人(微信ID:CVer222)加入。请附上你的单位。
本仓库包括详细介绍、强大的基准模型(搜索与识别网络,SINet)以及一键评估代码,用于伪装物体检测(COD)。
如果你对我们的论文有任何问题,请随时通过电子邮件联系樊登平或纪戈鹏。如果你在研究中使用SINet或评估工具箱,请引用本文。
SINet
├── EvaluationTool
│ ├── CalMAE.m
│ ├── Enhancedmeasure.m
│ ├── Fmeasure_calu.m
│ ├── main.m
│ ├── original_WFb.m
│ ├── S_object.m
│ ├── S_region.m
│ └── StructureMeasure.m
├── Images
│ ├── CamouflagedTask.png
│ ├── CamouflagingFromMultiView.png
│ ├── CmpResults.png
│ ├── COD10K-2.png
│ ├── COD10K-3.png
│ ├── COVID'19-Infection.png
│ ├── locust detection.png
│ ├── new_score_1.png
│ ├── PolypSegmentation.png
│ ├── QuantitativeResults-new.png
│ ├── SampleAquaticAnimals.png
│ ├── Search-and-Rescue.png
│ ├── SINet.png
│ ├── SubClassResults-1.png
│ ├── SubClassResults.png
│ ├── Surface defect Detection2.png
│ ├── TaskRelationship.png
│ ├── Telescope.png
│ └── UnderwaterEnhancment.png
├── MyTest.py
├── README.md
├── requirement.txt
└── Src
├── backbone
├── __init__.py
├── SearchAttention.py
├── SINet.py
└── utils
显著物体检测(SOD)基准工作的参考文献<br> [1] 视频SOD: 将更多注意力转移到视频显著物体检测上。CVPR, 2019。(项目主页)<br> [2] RGB SOD: 杂乱中的显著物体:将显著物体检测带到前景。ECCV, 2018。(项目主页)<br> [3] RGB-D SOD: 重新思考RGB-D显著物体检测:模型、数据集和大规模基准。TNNLS, 2020。(项目主页)<br> [4] 协同SOD: 深入研究协同显著物体检测。CVPR, 2020。(项目主页)
训练和测试实验使用PyTorch在一块24GB显存的GeForce RTX TITAN GPU上进行。
注意,我们的模型也支持低内存GPU,这意味着你可以降低批次大小 (在
apex-mode=O1模式下每张图像约419 MB,在apex-mode=O2模式下每张图像约305 MB)
配置环境(先决条件):
注意,SINet仅在具有以下环境的Ubuntu操作系统上进行了测试。 它可能也适用于其他操作系统,但我们不能保证。
在终端中创建虚拟环境:conda create -n SINet python=3.6。
安装 必要的包:pip install -r requirements.txt。
(可选:仅用于训练)安装NVIDIA-Apex 以使用混合精度加速训练过程。 (安装说明) (在CUDA-10.0和Cudnn-7.4下)。
下载训练和测试集:
下载新的测试数据集(COD10K-test + CAMO-test + CHAMELEON)并将其移动到./Dataset/TestDataset/,
可以在这个Google Drive链接或百度网盘链接(提取码:z83z)中找到。
下载新的训练数据集(COD10K-train),可以在这个Google Drive链接或百度网盘链接(提取码:djq2)中找到。请参考我们的原始论文了解其他训练数据。
测试配置:
下载所有预训练模型和测试数据后,只需运行MyTest.py即可生成最终的预测图:
替换你的训练模型目录(--model_path)并指定推理掩码的保存目录(--test_save)
请注意,我们重新训练了我们的模型(在下图中标记为$\diamondsuit$),采用Apex库的混合训练策略(mode=O1),
在40个epoch后获得了更好的性能。这里我们提供了一个新的预训练模型
(百度网盘 [提取码:2pp2]/Google Drive)。之后,我们将尝试基于不同骨干网络的SINet来提高性能,
并提供更全面的比较。
评估你训练的模型:
main.m中的说明操作,只需运行它即可在
./EvaluationTool/EvaluationResults/Result-CamObjDet/中生成评估结果。我们提供了完整且公平的一键式评估工具箱,用于在统一标准内进行基准测试。 更多信息请参考以下链接: Matlab版本:https://github.com/DengPingFan/CODToolbox Python版本:https://github.com/lartpang/PySODMetrics
--> 点击此处探索更多有趣内容(YouTube链接) <--
如果您认为本工作有用,请引用我们的论文:
@inproceedings{fan2020Camouflage,
title={Camouflaged Object Detection},
author={Fan, Deng-Ping and Ji, Ge-Peng and Sun, Guolei and Cheng, Ming-Ming and Shen, Jianbing and Shao, Ling},
booktitle={IEEE Conference on Computer Vision and Pattern Recognition (CVPR)},
year={2020}
}
COD10K数据集仅供非商业用途使用。
您不得直接或间接地复制、使用或传播COD10K数据集或任何内容,或由此衍生的任何工作成果或数据用于商业目的。
本代码仅供学术交流使用,不得用于商业目的。如需商业使用,请与我联系。
在遵守以下条件的情况下,允许redistribution和使用源代码,无论是否经过修改:
源代码的redistribution必须保留上述版权声明、本条件列表和以下免责声明。
以二进制形式redistribution必须在随分发提供的文档和/或其他材料中复制上述版权声明、本条件列表和以下免责声明
本软件由版权所有者和贡献者"按原样"提供,不作任何明示或暗示的保证,包括但不限于对适销性和特定用途适用性的保证。在任何情况下,版权所有者或贡献者均不对任何直接、间接、偶然、特殊、惩戒性或后果性损害(包括但不限于替代商品或服务的采购;使用、数据或利润的损失;或业务中断)承担责任,无论是基于合同、严格责任还是侵权行为(包括疏忽或其他原因)的任何责任理论,即使事先被告知可能发生此类损害。
我们要感谢CHAMELEON和CAMO数据集的作者们的工作。他们在这些数据集上付出了巨大努力,推动了这一领域的发展。我们还要感谢图像标注人员以及Wenguan Wang、Geng Chen和Hongsong Wang提供的有见地的反馈和讨论。
如果您想提 高可用性或有任何建议,请随时直接与我联系(电子邮件)。
支持NVIDIA APEX训练。
支持不同的骨干网络( VGGNet、 ResNet、 ResNeXt、 Res2Net、 iResNet 和 ResNeSt 等)
支持分布式训练。
支持轻量级架构和实时推理,如MobileNet、SqueezeNet。
支持分布式训练
添加更多全面的竞争对手。
如果页面无法加载图片(主要在国内网络环境下)。


免费创建高清无水印Sora视频
Vora是一个免费创建高清无水印Sora视频的AI工具


最适合小白的AI自动化工作流平台
无需编码,轻松生成可复用、可变现的AI自动化工作流

大模型驱动的Excel数据处理工具
基于大模型交互的表格处理系统,允许用户通过对话方式完成数据整理和可视化分析。系统采用机器学习算法解析用户指令,自动执行排序、公式计算和数据透视等操作,支持多种文件格式导入导出。数据处理响应速度保持在0.8秒以内,支持超过100万行数据的即时分析。


AI辅助编程,代码自动修复
Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。


AI论文写作指导平台
AIWritePaper论文写作是一站式AI论文写作辅助工具,简化了选题、文献检索至论文撰写的整个过程。通过简单设定,平台可快速生成高质量论文大纲和全文,配合图表、参考文献等一应俱全,同时提供开题报告和答辩PPT等增值服务,保障数据安全,有效提升写作效率和论文质量。


AI一键生成PPT,就用博思AIPPT!
博思AIPPT,新一代的AI生成PPT平台,支持智能生成PPT、AI美化PPT、文本&链接生成PPT、导入Word/PDF/Markdown文档生成PPT等,内置海量精美PPT模板,涵盖商务、教育、科技等不同风格,同时针对每个页面提供多种版式,一键自适应切换,完美适配各种办公场景。


AI赋能电商视觉革命,一站式智能商拍平台
潮际好麦深耕服装行业,是国内AI试衣效果最好的软件。使用先进AIGC能力为电商卖家批量提供优质的、低成本的商拍图。合作品牌有Shein、Lazada、安踏、百丽等65个国内外头部品牌,以及国内10万+淘宝、天猫、京东等主流平台的品牌商家,为卖家节省将近85%的出图成本,提升约3倍出图效率,让品牌能够快速上架。


企业专属的AI法律顾问
iTerms是法大大集团旗下法律子品牌,基于最先进的大语言模型(LLM)、专业的法律知识库和强大的智能体架构,帮助企业扫清合规障碍,筑牢风控防线,成为您企业专属的AI法律顾问。


稳定高效的流量提升解决方案,助力品牌曝光
稳定高效的流量提升解决方案,助力品牌曝光


最新版Sora2模型免费使用,一键生成无水印视频
最新版Sora2模型免费使用,一键生成无水印视频
最新AI工具、AI资讯
独家AI资源、AI项目落地

微信扫一扫关注公众号