当前位置: 首页 > 专利查询>三峡大学专利>正文

一种基于像素级深度学习的混凝土坝表面裂缝检测方法技术

技术编号:38317447 阅读:10 留言:0更新日期:2023-07-29 08:59
一种基于像素级深度学习的混凝土坝表面裂缝检测方法,包括以下步骤:步骤1:获取混凝土坝表面裂缝图像和两阶段迁移学习训练方式;步骤2:构建大坝裂缝检测模型;步骤3:采用大坝裂缝检测模型对混凝土坝表面裂缝图像中的每个像素点进行识别,并获取混凝土坝的裂缝形状检测结果。本发明专利技术的目的是为了解决现有技术存在的坝面数据图像采集困难、数据标注人工成本高,使大坝裂缝数据集缺乏导致模型训练欠拟合、不充分、检测精度低以及现有方法对微小裂缝所占的像素点少、裂缝与周边环境对比度低,导致模型对坝面裂缝特征信息提取能力弱、细小裂缝分割能力弱、像素准确率低的技术问题,而提供的一种基于像素级深度学习的混凝土坝表面裂缝检测方法。面裂缝检测方法。面裂缝检测方法。

【技术实现步骤摘要】
一种基于像素级深度学习的混凝土坝表面裂缝检测方法


[0001]本专利技术属于混凝土裂缝检测
,具体涉及一种基于像素级深度学习的混凝土坝表面裂缝检测技术。

技术介绍

[0002]混凝土坝长期暴露于大气与水环境中,承受水流冲刷、温度变化以及干湿、冻融等外界作用,其表面不可避免会出现缺陷,其中裂缝是威胁坝体安全稳定的最主要因素。裂缝不仅存在于大坝表面,若不及时处理还将延伸至坝体内部,影响大坝的强度和使用寿命,甚至引发渗漏、坍塌等安全事故。因此,及时识别和检测混凝土坝表面裂缝对预示工程险情和保障大坝安全具有重要意义。
[0003]在现有技术中,基于计算机视觉的裂缝图像检测方法已经得到了相关研究,且可分为传统图像分割方法和深度学习语义分割方法。传统图像分割方法主要是利用图像中裂缝自身像素的灰度值比背景低、图像二值化、图像滤波器和数值图像等低阶视觉信息实现对裂缝的识别分割。与人工直接检测相比,传统图像分割方法具备一定安全性和可行性,但当背景存在大量噪声时精度低,易受外界因素干扰,分割结果不准确。而且该类方法对裂缝进行检测时步骤较多,需要人为不断进行调整参数以适应分割场景,检测效率低,在精度和效率上满足不了实际工程场景应用需要,需要进一步建立精确、高效的裂缝智能分割方法。
[0004]相较基于低阶视觉信息的传统图像分割方法,深度学习语义分割方法采用的高阶视觉信息具有更高的精度和鲁棒性。经过对现有研究分析,深度学习语义分割算法对裂缝检测具备了可行性,但大部分研究主要是基于公开数据集下的房屋建筑物、路面、桥梁裂缝实验研究,而对混凝土坝裂缝安全检测的研究较少。公开号为CN115731172A的专利公开了一种基于图像增强和纹理提取的裂缝检测方法,通过添加注意力的方式改进Unet网络检测裂缝,但没有建立残差网络,不能通过增加网络深度来强化模型的特征提取能,导致特征信息提取有限,检测能力弱。公开号为CN115131664A的专利公开了一种混凝土细小裂缝识别方法,提高混凝土细小裂缝的检测精度,但该方法数据集需要采集大量数据集,且人工标注费时费力。
[0005]因此,若直接将上述现有技术应用于混凝土坝表面裂缝检测还存在以下问题:
[0006]1)坝面裂缝图像的采集和数据标注人工成本高,导致坝面裂缝数据集稀缺,数据集不足会严重影响裂缝特征提取和图像分割。由于公开数据集中的裂缝与坝面裂缝特征和分别差异较大,不能直接将公开裂缝数据集扩充到坝面裂缝图像中,混凝土坝裂缝数据集样本量少会导致模型训练不充分,易出现漏检;
[0007]2)混凝土坝图像中裂缝所占的像素点少,而背景却占了图像绝大部分,导致模型对坝面裂缝特征信息提取不充分,细小裂缝分割能力弱;
[0008]3)实际工程中的裂缝更具复杂性,现有算法对光照不均、裂缝与周边环境对比度低等情况下的混凝土坝裂缝检测鲁棒性低、像素准确率低,使边缘分割平滑。

技术实现思路

[0009]本专利技术的目的是为了解决现有技术存在的坝面数据图像采集困难、数据标注人工成本高,使大坝裂缝数据集缺乏导致模型训练欠拟合、不充分、检测精度低以及现有方法对微小裂缝所占的像素点少、裂缝与周边环境对比度低,导致模型对坝面裂缝特征信息提取能力弱、细小裂缝分割能力弱、像素准确率低的技术问题,而提供的一种基于像素级深度学习的混凝土坝表面裂缝检测方法。
[0010]为解决上述技术问题,本专利技术采用的技术方案为:
[0011]一种基于像素级深度学习的混凝土坝表面裂缝检测方法,包括以下步骤:
[0012]步骤1:获取混凝土坝表面裂缝图像和两阶段迁移学习训练方式;
[0013]步骤2:构建大坝裂缝检测模型;
[0014]步骤3:采用大坝裂缝检测模型对混凝土坝表面裂缝图像中的每个像素点进行识别,并获取混凝土坝的裂缝形状检测结果。
[0015]在步骤1中,具体包括以下子步骤:
[0016]步骤1

1:进行训练模型数据集的采集:
[0017](1)本专利技术用来训练模型的数据集有3部分,分别为PASCAL VOC 2012数据集、第一阶段跨域训练裂缝数据集DatasetA和第二阶段目标域混凝土坝表面裂缝图像数据集DatasetB;
[0018](2)PASCAL VOC 2012为计算机视觉挑战赛数据集,由1464张训练集图像、1449张验证集图像组成,包含20类别和1个背景。
[0019](3)第一阶段跨域训练裂缝数据集DatasetA通过收集网上公开裂缝数据集CrackForest,SDNET2018,Aft Original Crack DataSet Second组成。
[0020](4)第二阶段目标域混凝土坝表面裂缝图像数据集DatasetB通过无人机对混凝土坝表面进行采集,无人机依次经过大坝裂缝易形成的关键点位拍摄图像,最后将采集的巡检数据的图片或视频储存在机身内置的SSD卡中并返回到起航点。
[0021]步骤1

2:进行训练模型数据集的制作:
[0022](1)人工采用Labelme标注工具手动对第二阶段目标域DatasetB进行像素级标注。
[0023](2)为保障该数据集能适应不同复杂环境,使得模型具备更强的泛化能力和鲁棒性,对第二阶段目标域DatasetB进行了扩充。
[0024](3)图像标注后经过图像增强算法Retinex、调整图像光度、对比度和空间变化(随机旋转、翻转)对图像进行了扩充。
[0025](4)第二阶段目标域DatasetB按比例8:2随机划分为训练集和验证集。
[0026]步骤1

3:进行两阶段迁移学习训练:
[0027](1)训练初始,在输入端设置将所有数据集图像重塑其尺寸为512
×
512像素大小;
[0028](2)模型训练Batch_Size为8、Epoch为300、优化器为Adam、Momentum为0.9、初始学习率为0.0001、学习率下降方式为CosineAnnealingLR、损失函数为Cross Entropy Loss;
[0029][0030]y为真实值分布;为网络输出分布;n为总类别数;
[0031](3)第一阶段是基于跨域的模型知识迁移,即利用源域对目标域共享模型参数。利
用源域PASCAL VOC 2012数据集模型得到的训练结果作为第一阶段目标域DatasetA的预训练模型,在源域和目标域中找到两者之间共享的参数信息,使第一阶段目标域DatasetA在训练过程中从算法和模型的角度进行参数更新,避免网络从零学习,使第二阶段能获得一个更好的导师模型;
[0032](4)第二阶段是基于域内的特征知识迁移,即将源域和目标域的特征从原始特征空间映射到新特征空间中。将第一阶段迁移学习后的DatasetA预训练模型作为第二阶段的源域,从相关领域中学习相同信息和知识结构,通过迁移学习方法将源域中存在与目标域相同的特征表示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于像素级深度学习的混凝土坝表面裂缝检测方法,其特征在于,包括以下步骤:步骤1:获取混凝土坝表面裂缝图像和两阶段迁移学习训练方式;步骤2:构建大坝裂缝检测模型;步骤3:采用大坝裂缝检测模型对混凝土坝表面裂缝图像中的每个像素点进行识别,并获取混凝土坝的裂缝形状检测结果。2.根据权利要求1所述的方法,其特征在于,在步骤1中,具体包括以下子步骤:步骤1

1:进行训练模型数据集的采集;步骤1

2:进行训练模型数据集的制作:步骤(1)采用Labelme标注工具对第二阶段目标域DatasetB进行像素级标注,进入步骤(2);步骤(2)对步骤(1)标注后的第二阶段目标域DatasetB经过图像增强算法Retinex、调整图像光度、对比度和空间变化进行扩充,进入步骤(3);步骤(3)将步骤(2)第二阶段目标域DatasetB按一定比例随机划分为训练集和验证集;步骤1

3:进行两阶段迁移学习训练:步骤(1)训练初始,在输入端设置将所有数据集图像尺寸重塑为统一像素大小,进入步骤(2);步骤(2)调整模型训练参数Batch_Size、Epoch、优化器、初始学习率,学习率下降方式为CosineAnnealingLR、损失函数为Cross Entropy Loss,进入步骤(3);y为真实值分布;为网络输出分布;n为总类别数;i为变量;步骤(3)利用第一阶段源域数据集模型得到的训练结果作为第一阶段目标域DatasetA的预训练模型,进入步骤(4);步骤(4)第一阶段是基于跨域的模型知识迁移,避免网络从零学习,使第二阶段获得一个更好的导师模型,进入步骤(5);步骤(5)第二阶段是基于域内的特征知识迁移,将第一阶段迁移学习后的DatasetA预训练模型作为第二阶段的源域,通过迁移学习方法将源域中存在与目标域相同的特征表示迁移到第二阶段目标域DatasetB中;步骤(6)第一阶段和第二阶段在图像特征上是相同领域,为加快训练效率和防止权值被破坏,在第二阶段迁移训练中加入了冻结训练步骤,即在训练的前半部分冻结主干网络,仅对解码分类器进行训练,后半部分解冻对整个网络进行训练学习。3.根据权利要求1所述的方法,其特征在于,在步骤2中,具体包括以下子步骤:步骤2

1:搭建ResNet50网络作为UNet模型编码器的特征提取网络,通过Residual模块加深网络层数和提取能力充分获取裂缝特征信息,使模型可以有效地学习坝面裂缝的深层特征,提高模型对裂缝分割精度;步骤2

2:将多层并行残差注意力添加到UNet模型跳跃连接层中,通过获取更多语义信息以增强模型的特征表达能力,以抑制无关区域中的特征响应,提高有效特征信息通道的
重要性,使网络专注于裂缝特征信息,补充细节损失,使模型更精确对坝面裂缝图像进行分割。4.根据权利要求1或3所述的方法,其特征在于,在步骤2中,具体的,图像通过ResNet50残差网络结构进行特征提取,在UNet模型跳跃连接中设置多层并行残差注意力模块MPRAttention获取更多语义信息以增强模型的特征表达能力,最后通过UNet解码器预测对图像裂缝,所建立的大坝裂缝检测模型的具体结构为:检测图像视频通过一次卷积,BN,RuLu

Maxpool

第一编码特征图F1;第一编码特征图F1→
残差模块,得到第二编码特征图F2;第一编码特征图F1→
MPRAttention,得到第一增强特征图U1;第二编码特征图F2→
残差模块,得到第三编码特征图F3;第二编码特征图F2→
MPRAttention,得到第二增强特征图U2;第三编码特征图F3→
残差模块,得到第四编码特征图F4;第三编码特征图F3→
MPRAttention,得到第三...

【专利技术属性】
技术研发人员:李健源卢晓春张萍陈博夫熊勃勃李青泉陈雷刘晓双宁李玉钦
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1