一种基于BA-Unet的水下声呐图像数据分割方法技术

技术编号:26379993 阅读:16 留言:0更新日期:2020-11-19 23:48
本发明专利技术公开了一种基于BA‑Unet的水下声呐图像数据分割方法,属于土木工程与计算机视觉技术领域。本发明专利技术通过BA‑Unet网络基于训练数据集进行训练,将新拍摄的水下声呐图像数据输入训练好的BA‑Unet网络模型中,获取其分割结果,在通道维度上,获取其最大值对应的index,即为对应的结构标签。本发明专利技术能够得到水下声呐图像数据的水面、柱子以及河床,可用于辅助识别水下结构缺陷、河床断面形状、基础冲刷程度等。

【技术实现步骤摘要】
一种基于BA-Unet的水下声呐图像数据分割方法
本专利技术涉及土木工程与计算机视觉
,具体涉及一种基于BA-Unet的水下声呐图像数据分割方法。
技术介绍
水下基础是桥梁的根基,其病害严重威胁桥梁运营安全,但目前桥梁水下基础检测在常规检测中并未得到足够重视,水下基础检测主要采用人工探摸的手段进进行,检测效率较低,且浑浊水质条件下无法直观反映水下基础情况,水下声呐成像技术是远距离获取水下目标信息的有效方式,但存在成像后的图像质量差、对比度低等问题,严重影响后续图像分割,声呐图像分割重点在于不破坏原始图像边缘信息前提下从复杂水下混响区分割出目标区和背景区,因此提出一种水下声呐图像数据分割方法来克服现有技术对水下声呐图像数据边缘分割不准确的缺点对于声呐图像处理有着很重要的意义。对于依托此技术来进行水下的病害检测也有着非常重要的意义。
技术实现思路
本专利技术的目的是提供一种基于BA-Unet的水下声呐图像数据分割方法,以克服现有技术对水下声呐图像数据边缘分割不准确的缺点。本专利技术的技术方案是:一种基于BA-Unet的水下声呐图像数据分割方法,包括如下步骤:S1:利用扫描声呐设备获取水下声呐图像数据;S2:对获得的水下声呐图像数据进行像素级标注,其中,背景部分标注为0,柱子部分标注为1,河床部分标注为2,水面部分标注为3;S3:将标注好的水下声呐图像数据进行数据划分,其中90%作为训练集,10%作为验证集;S4:构建EdgeBranch,获取其对应的输出——AttentionMap,并基于Attention-Map构建BA-Unet网络;S5:BA-Unet基于S3得到的训练集进行训练,并基于在验证集上的表现保存表现最好的模型权重参数;S6:利用训练好的模型,对新扫描的水下声呐图像数据,预处理后输入模型中,并对模型输出进行处理,得到最终的水面、柱子以及河床的分割结果。进一步的技术方案,步骤S1中,利用扫描声呐设备获取水下声呐图像数据。进一步的技术方案,步骤S2中,对步骤S1中获得的水下声呐图像数据进行像素级标注,其中,背景部分标注为0,柱子部分标注为1,河床部分标注为2,水面部分标注为3。进一步的技术方案,步骤S3中,将标注好的水下声呐图像数据进行数据划分,其中90%作为训练集,10%作为验证集。进一步的技术方案,步骤S4中,构建EdgeBranch,获取其对应的输出——AttentionMap,并基于Attention-Map构建BA-Unet网络,其中分为以下步骤:S4.1在unet的decoder部分,对应的每个decoder模块由upsampling和convolution组成,基于convolution输出的featuremap,通过一个1x1的卷积以及sigmoid激活,预测当前尺寸的各个结构的边缘,包括水面边缘、柱子边缘以及河床边缘,结构边缘由mask矩阵生成;S4.2基于S4.1结构中sigmoid输出的概率矩阵——AttentionMap,与对应的skipfeaturemap相乘,相乘后得到的特征和upsampling得到的featuremap在通道维度上进行联结,然后再进行后续计算。该过程通过AttentionMap,增大边缘部分的特征权重,强化模型边缘的学习;S4.3损失函数包含两大部分,第一部分是mask分割的maskloss,第二部分为对应不同的EdgeBranch的Edgeloss。其中,maskloss采用加权交叉熵损失以及各类别的dice损失,Edgeloss采用diceloss,最终的优化目标函数如下:Loss=weighted_categorical_crossentropy+Sum(dice_loss(mask)formaskinall_masks)+Sum(dice_loss(edge)foredgeinallEdgeBranch)进一步的技术方案,步骤S5中,BA-Unet基于S3得到的训练集进行训练,并基于在验证集上的表现保存表现最好的模型权重参数。进一步的技术方案,,步骤S6中,利用训练好的模型,对新扫描的水下声呐图像数据,预处理后输入模型中,并对模型输出进行处理,得到最终的水面、柱子以及河床的分割结果。方法原理:基于经典的Unet网络,提出BA-Unet卷积神经网络模型获取水下声呐图像的水面、柱子、河床等结构。BA-Unet通过加入EdgeBranch,并基于该Branch输出的AttentionMap,对skipfeaturemap进行加权,强调了边缘特征,增强网络对边缘的学习。本专利技术的有益效果:与现有技术相比,本专利技术具有以下显著优点:本专利技术所述的方法能够准确识别水下声呐图像的水面、柱子以及河床,相较于传统的常用的传统数字图像处理方法如边缘检测、阈值法、光谱分析法,具有自适应性,无需根据环境设置不同的参数,同时,相较于现有的深度学习网络,本专利技术提出的方法优化了对结构边缘的识别,提高了分割精度,对于复杂的环境,更加稳定,鲁棒性强。该方法是一套端到端的训练方法,也可以用于其他边缘模糊的分割任务中。附图说明图1为本专利技术基于BA-Unet的混凝土裂缝分割方法流程图。图2为本专利技术BA-Unet网络结构图。具体实施方式下面结合附图对本专利技术的技术方案作进一步说明。如图1所示,一种基于BA-Unet的混凝土裂缝分割方法包括如下步骤:S1:利用扫描声呐设备获取水下声呐图像数据;S2:对获得的水下声呐图像数据进行像素级标注,其中,背景部分标注为0,柱子部分标注为1,河床部分标注为2,水面部分标注为3;S3:将标注好的水下声呐图像数据进行数据划分,其中90%作为训练集,10%作为验证集;S4:构建EdgeBranch,获取其对应的输出——AttentionMap,并基于Attention-Map构建BA-Unet网络;S5:BA-Unet基于S3得到的训练集进行训练,并基于在验证集上的表现保存表现最好的模型权重参数;S6:利用训练好的模型,对新扫描的水下声呐图像数据,预处理后输入模型中,并对模型输出进行处理,得到最终的水面、柱子以及河床的分割结果。步骤S1中,利用扫描声呐设备获取水下声呐图像数据。步骤S2中,对获得的水下声呐图像数据进行像素级标注,其中,背景部分标注为0,柱子部分标注为1,河床部分标注为2,水面部分标注为3。步骤S3中,将标注好的水下声呐图像数据进行数据划分,其中90%作为训练集,10%作为验证集。步骤S4中,构建EdgeBranch,获取其对应的输出——AttentionMap,并基于Attention-Map构建BA-Unet网络。EdgeBranch的构建过程:unet的decoder部分,对应的每个decoder模块由upsampling和convolution组成,基于convo本文档来自技高网...

【技术保护点】
1.一种基于BA-Unet的水下声呐图像数据分割方法,其特征在于:包括如下步骤:/nS1:利用扫描声呐设备获取水下声呐图像数据;/nS2:对获得的水下声呐图像数据进行像素级标注,其中,背景部分标注为0,柱子部分标注为1,河床部分标注为2,水面部分标注为3;/nS3:将标注好的水下声呐图像数据90%作为训练集,10%作为验证集,进行数据集划分;/nS4:构建Edge Branch,获取其对应的输出——Attention Map,并基于Attention-Map构建BA-Unet网络;/nS5:BA-Unet基于S3得到的训练集进行训练,并基于在验证集上的表现保存表现最好的模型权重参数;/nS6:利用训练好的模型,对新扫描的水下声呐图像数据,预处理后输入模型中,并对模型输出进行处理,得到最终的水面、柱子以及河床的分割结果。/n

【技术特征摘要】
1.一种基于BA-Unet的水下声呐图像数据分割方法,其特征在于:包括如下步骤:
S1:利用扫描声呐设备获取水下声呐图像数据;
S2:对获得的水下声呐图像数据进行像素级标注,其中,背景部分标注为0,柱子部分标注为1,河床部分标注为2,水面部分标注为3;
S3:将标注好的水下声呐图像数据90%作为训练集,10%作为验证集,进行数据集划分;
S4:构建EdgeBranch,获取其对应的输出——AttentionMap,并基于Attention-Map构建BA-Unet网络;
S5:BA-Unet基于S3得到的训练集进行训练,并基于在验证集上的表现保存表现最好的模型权重参数;
S6:利用训练好的模型,对新扫描的水下声呐图像数据,预处理后输入模型中,并对模型输出进行处理,得到最终的水面、柱子以及河床的分割结果。


2.根据权利要求1所述的一种基于BA-Unet的水下声呐图像数据分割方法,其特征在于:步骤S1中,利用扫描声呐设备获取水下声呐图像数据...

【专利技术属性】
技术研发人员:戴姣吕艳洁王畅
申请(专利权)人:江苏东印智慧工程技术研究院有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1