DeepCrack

DeepCrack

深度学习驱动的自动裂缝检测网络

DeepCrack是一种端到端深度卷积神经网络,用于自动裂缝检测。该网络通过学习分层卷积特征来表示裂缝,融合多尺度特征以捕捉线性结构。基于SegNet架构,DeepCrack在三个挑战性数据集上平均F值超过0.87,性能优于现有方法。项目提供四个裂缝数据集和预训练模型,为相关研究提供支持。

DeepCrack裂缝检测卷积神经网络图像处理深度学习Github开源项目

DeepCrack:学习分层卷积特征用于裂缝检测

我们提供代码、数据集和预训练模型。

Zou Q, Zhang Z, Li Q, Qi X, Wang Q 和 Wang S, DeepCrack: 学习分层卷积特征用于裂缝检测, IEEE 图像处理汇刊, 第28卷, 第3期, 第1498-1512页, 2019年。 [PDF]

  • 摘要:裂缝是许多计算机视觉应用中感兴趣的典型线性结构。在实践中,许多裂缝(如路面裂缝)表现出连续性差和对比度低的特点,这给基于图像的裂缝检测带来了巨大挑战,难以使用低级特征进行检测。在本文中,我们提出了DeepCrack——一种端到端可训练的深度卷积神经网络,通过学习裂缝表示的高级特征来实现自动裂缝检测。在这种方法中,我们将分层卷积阶段学习到的多尺度深度卷积特征融合在一起,以捕捉线性结构。较大尺度的特征图提供更详细的表示,而较小尺度的特征图则提供更整体的表示。我们基于SegNet的编码器-解码器架构构建DeepCrack网络,并在相同尺度上成对融合编码器网络和解码器网络中生成的卷积特征。我们在一个裂缝数据集上训练DeepCrack网络,并在其他三个数据集上评估其性能。实验结果表明,DeepCrack在三个具有挑战性的数据集上平均达到超过0.87的F值,优于当前最先进的方法。

网络架构

图片

部分结果

图片

DeepCrack数据集

DeepCrack使用了四个数据集。CrackTree260用于训练,其他三个用于测试。

CrackTree260数据集

<div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/9085201b-8927-4094-b6d8-b0a3247583df.jpg" height="200" width="260" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/ffcfec10-9882-46d4-89f8-d4b83ba5da73.jpg" height="200" width="260" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/751a4316-19ab-48de-83cc-187d76487a72.jpg" height="200" width="260" > </div> <div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/ed592c08-9651-41cb-85c3-1963ebd833f4.jpg" height="200" width="260" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/6506ace7-d31e-435f-bd96-823f5d1f4edd.jpg" height="200" width="260" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/176f7a17-3561-4d8e-84dc-ddf7ff13bfaf.JPG" height="200" width="260" > </div>
  • 它包含260张路面图像 - 是[CrackTree, PRL, 2012]中使用的数据集的扩展版。这些路面图像是在可见光照明条件下由面阵相机拍摄的。我们使用全部260张图像进行训练。我们进行了数据增强以扩大训练集的规模。我们以9个不同的角度(从0到90度,间隔10度)旋转图像,在每个角度上垂直和水平翻转图像,并在每张翻转的图像上裁剪5个子图像(4个角落和1个中心),尺寸为512×512。经过增强后,我们总共得到了35,100张训练图像。

CRKWH100数据集

<div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/b8fb8754-017e-4ee5-955a-571653597acc.png" height="200" width="200" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/c9985d4c-11c1-46ee-810b-d4d4501bc4fa.png" height="200" width="200" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/68e47846-55ce-47bf-bc54-dfe53410729d.png" height="200" width="200" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/6b370e28-712d-407a-ab90-15b33407b23d.png" height="200" width="200" > </div> <div align="center"> <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/f0d46f54-ebc2-4d41-b413-58fae038b822.png" height="200" width="200" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/385f78af-d2aa-488d-a019-8434ccb7c725.png" height="200" width="200" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/dc025a18-d2b3-4a4f-bad9-b95768ece827.png" height="200" width="200" > <img src="https://yellow-cdn.veclightyear.com/0a4dffa0/2eb1f208-79bc-4641-9f82-bdcc1f32ce68.png" height="200" width="200" > </div>
  • 它包含100张在可见光照明条件下由线阵相机拍摄的路面图像。线阵相机以1毫米的地面采样距离捕捉路面。

CrackLS315数据集

  • 它包含315张在激光照明条件下拍摄的路面图像。这些图像也是由线阵相机拍摄的,地面采样距离相同。

Stone331数据集

  • 它包含331张石材表面图像。在切割石材时,切割表面可能会出现裂缝。这些图像是在可见光照明条件下由面阵相机拍摄的。我们为图像中每个石材表面的区域生成了一个掩码。这样就可以将性能评估限制在石材表面上。

下载:

您可以从以下链接下载四个数据集,

CrackTree260 与 GT 数据集: https://1drv.ms/f/s!AittnGm6vRKLyiQUk3ViLu8L9Wzb 

CRKWH100 数据集: https://1drv.ms/f/s!AittnGm6vRKLtylBkxVXw5arGn6R 
CRKWH100 GT: https://1drv.ms/f/s!AittnGm6vRKLglyfiCw_C6BDeFsP

CrackLS315 数据集: https://1drv.ms/f/s!AittnGm6vRKLtylBkxVXw5arGn6R 
CrackLS315 GT: https://1drv.ms/u/s!AittnGm6vRKLg0HrFfJNhP2Ne1L5?e=WYbPvF

Stone331 数据集: https://1drv.ms/f/s!AittnGm6vRKLtylBkxVXw5arGn6R 
Stone331 GT: https://1drv.ms/f/s!AittnGm6vRKLwiL55f7f0xdpuD9_
Stone331 掩码: https://1drv.ms/u/s!AittnGm6vRKLxmFB78iKSxTzNLRV?e=9Ph5aP

您也可以从以下链接下载数据集
链接:https://pan.baidu.com/s/1PWiBzoJlc8qC8ffZu2Vb8w
提取码:zfoo

结果:

我们数据集上的一些结果: 图片 图片 图片

环境配置

要求

PyTorch 1.0.2 或更高版本
Python 3.6
CUDA 10.0
我们在Intel Core Xeon E5-2630@2.3GHz处理器、64GB内存和两块GeForce GTX TITAN-X GPU上运行。

预训练模型

PyTorch预训练模型可在以下链接获取,
https://drive.google.com/file/d/1OO3OAzR4yxYh_UBR9Nu7hV3XayfKVyO-/view?usp=sharing
或者链接:https://pan.baidu.com/s/1WsIwVnDgtRBpJF8ktlN84A
提取码:27py
您可以下载它们并将其放入"./codes/checkpoints/"目录。

请注意,由于此模型是使用PyTorch训练的,其性能与原始Caffe版本略有不同。

训练

训练前,请在config.py中修改路径,包括"train_path"(用于train_index.txt)和"pretrained_path",以适应您的环境。
选择模型并在config.py中调整参数,如类别权重、批量大小、学习率等。
然后直接运行:

python train.py 

测试

要评估预训练模型的性能,请首先将上述预训练模型或您自己的模型放入"./codes/checkpoints/"目录,并在config.py中更改"pretrained_path",然后更改"test_path"以指向test_index.txt,以及"save_path"以保存结果。
选择要评估的正确模型,然后直接运行:

python test.py

引用:

如果您在自己的研究中使用我们的代码或数据集,请按以下方式引用:

@article{zou2018deepcrack,
  title={Deepcrack: Learning Hierarchical Convolutional Features for Crack Detection},
  author={Zou, Qin and Zhang, Zheng and Li, Qingquan and Qi, Xianbiao and Wang, Qian and Wang, Song},
  journal={IEEE Transactions on Image Processing},
  volume={28},
  number={3},
  pages={1498--1512},
  year={2019},
}

CrackTree260数据集是基于CrackTree206数据集构建的。详情请参考

@article{zou2012cracktree,
  title={CrackTree: Automatic crack detection from pavement images},
  author={Zou, Qin and Cao, Yu and Li, Qingquan and Mao, Qingzhou and Wang, Song},
  journal={Pattern Recognition Letters},
  volume={33},
  number={3},
  pages={227--238},
  year={2012},
  publisher={Elsevier}
}

版权:

此数据集仅用于学术研究。

联系方式:

如有任何关于该数据集或代码的问题,请联系邱卓博士 (qzou@whu.edu.cn)。

编辑推荐精选

讯飞智文

讯飞智文

一键生成PPT和Word,让学习生活更轻松

讯飞智文是一个利用 AI 技术的项目,能够帮助用户生成 PPT 以及各类文档。无论是商业领域的市场分析报告、年度目标制定,还是学生群体的职业生涯规划、实习避坑指南,亦或是活动策划、旅游攻略等内容,它都能提供支持,帮助用户精准表达,轻松呈现各种信息。

AI办公办公工具AI工具讯飞智文AI在线生成PPTAI撰写助手多语种文档生成AI自动配图热门
讯飞星火

讯飞星火

深度推理能力全新升级,全面对标OpenAI o1

科大讯飞的星火大模型,支持语言理解、知识问答和文本创作等多功能,适用于多种文件和业务场景,提升办公和日常生活的效率。讯飞星火是一个提供丰富智能服务的平台,涵盖科技资讯、图像创作、写作辅助、编程解答、科研文献解读等功能,能为不同需求的用户提供便捷高效的帮助,助力用户轻松获取信息、解决问题,满足多样化使用场景。

热门AI开发模型训练AI工具讯飞星火大模型智能问答内容创作多语种支持智慧生活
Spark-TTS

Spark-TTS

一种基于大语言模型的高效单流解耦语音令牌文本到语音合成模型

Spark-TTS 是一个基于 PyTorch 的开源文本到语音合成项目,由多个知名机构联合参与。该项目提供了高效的 LLM(大语言模型)驱动的语音合成方案,支持语音克隆和语音创建功能,可通过命令行界面(CLI)和 Web UI 两种方式使用。用户可以根据需求调整语音的性别、音高、速度等参数,生成高质量的语音。该项目适用于多种场景,如有声读物制作、智能语音助手开发等。

Trae

Trae

字节跳动发布的AI编程神器IDE

Trae是一种自适应的集成开发环境(IDE),通过自动化和多元协作改变开发流程。利用Trae,团队能够更快速、精确地编写和部署代码,从而提高编程效率和项目交付速度。Trae具备上下文感知和代码自动完成功能,是提升开发效率的理想工具。

AI工具TraeAI IDE协作生产力转型热门
咔片PPT

咔片PPT

AI助力,做PPT更简单!

咔片是一款轻量化在线演示设计工具,借助 AI 技术,实现从内容生成到智能设计的一站式 PPT 制作服务。支持多种文档格式导入生成 PPT,提供海量模板、智能美化、素材替换等功能,适用于销售、教师、学生等各类人群,能高效制作出高品质 PPT,满足不同场景演示需求。

讯飞绘文

讯飞绘文

选题、配图、成文,一站式创作,让内容运营更高效

讯飞绘文,一个AI集成平台,支持写作、选题、配图、排版和发布。高效生成适用于各类媒体的定制内容,加速品牌传播,提升内容营销效果。

热门AI辅助写作AI工具讯飞绘文内容运营AI创作个性化文章多平台分发AI助手
材料星

材料星

专业的AI公文写作平台,公文写作神器

AI 材料星,专业的 AI 公文写作辅助平台,为体制内工作人员提供高效的公文写作解决方案。拥有海量公文文库、9 大核心 AI 功能,支持 30 + 文稿类型生成,助力快速完成领导讲话、工作总结、述职报告等材料,提升办公效率,是体制打工人的得力写作神器。

openai-agents-python

openai-agents-python

OpenAI Agents SDK,助力开发者便捷使用 OpenAI 相关功能。

openai-agents-python 是 OpenAI 推出的一款强大 Python SDK,它为开发者提供了与 OpenAI 模型交互的高效工具,支持工具调用、结果处理、追踪等功能,涵盖多种应用场景,如研究助手、财务研究等,能显著提升开发效率,让开发者更轻松地利用 OpenAI 的技术优势。

Hunyuan3D-2

Hunyuan3D-2

高分辨率纹理 3D 资产生成

Hunyuan3D-2 是腾讯开发的用于 3D 资产生成的强大工具,支持从文本描述、单张图片或多视角图片生成 3D 模型,具备快速形状生成能力,可生成带纹理的高质量 3D 模型,适用于多个领域,为 3D 创作提供了高效解决方案。

3FS

3FS

一个具备存储、管理和客户端操作等多种功能的分布式文件系统相关项目。

3FS 是一个功能强大的分布式文件系统项目,涵盖了存储引擎、元数据管理、客户端工具等多个模块。它支持多种文件操作,如创建文件和目录、设置布局等,同时具备高效的事件循环、节点选择和协程池管理等特性。适用于需要大规模数据存储和管理的场景,能够提高系统的性能和可靠性,是分布式存储领域的优质解决方案。

下拉加载更多