一种基于U-Net的红外图像语义分割方法技术

技术编号:32460800 阅读:61 留言:0更新日期:2022-02-26 08:49
一种基于U

【技术实现步骤摘要】
一种基于U

Net的红外图像语义分割方法


[0001]本专利技术涉及一种基于U

Net的红外图像语义分割方法,属于图像分割


技术介绍

[0002]图像语义分割是根据图像本身的纹理、颜色以及场景等信息,来得出图像中每个像素所属的类别信息。在语义分割任务中,需要准确地把图像中的每一个像素分类到一个特定的类别。图像语义分割可以提供物体在图像中的类别信息、位置信息、姿态信息以及环境信息等,这些信息能够有效地为其他计算机视觉任务提供基础,例如虚拟现实,自动驾驶、智能监控和红外图像应用等。然而,尽管在图像语义分割方面做了很多研究的工作,但是因为图像语义分割任务的复杂性,导致网络有着巨大的空间复杂度和计算复杂度,现在依然存在几个关键性问题,即图像语义分割精度不够、语义分割效率低和分割算法没有通用性。
[0003]中国专利公开号为“CN113096133A”,名称为“一种基于注意力机制的语义分割网络的构建方法”,该方法首先对数据集中的图像进行预处理;接着,利用语义分割网络对场景分割的图像进行分割;然后,通过损失函数调整模型参数,获得最优模型;最后,保存模型,对模型进行性能评估。该方法得到的分割图像质量差,不符合人眼视觉效果,同时实现过程复杂且效率低下。

技术实现思路

[0004]本专利技术为了解决现有的分割方法得到的图像精度差的问题,提供了一种基于U

Net的红外图像语义分割方法。使语义分割得到的图像具有更好的分割效果,更符合人眼视觉观察,同时本专利技术提出的方法实现过程简单,图像分割效率更高,通用性更强。
[0005]本专利技术解决技术问题的方案是:
[0006]一种基于U

Net的红外图像语义分割方法,包括如下步骤:
[0007]步骤1,构建网络模型:整个网络包括十三个卷积块,其中每个卷积块由跳跃连接、拼接操作、卷积层和激活函数组成;卷积块一、卷积块二、卷积块三和卷积块四对输入图片进行初级特征提取,卷积块五对图片中初级特征进行特征通道转换,卷积块六、卷积块七、卷积块八和卷积块九对图像中高级特征进行提取并重组,去除冗余信息,组合并保留有用信息,卷积块十、卷积块十一、卷积块十二和卷积块十三对图像使用卷积块对图像进行拼接操作,可以将图像的低级特征和高级特征进行混合,使得网络对于两种不同图像的特征提取能力更强,得到最终的语义分割图像;
[0008]步骤2,准备数据集:对整个卷积网络先用语义分割数据集进行训练;
[0009]步骤3,训练网络模型:将步骤2中准备好的数据集输入到步骤1中构建好的网络模型中进行训练;
[0010]步骤4,选择最小化损失函数和最优评估指标:通过最小化网络输出图像与标签的损失函数,直到训练次数达到设定阈值或损失函数的值到达设定范围内即可认为模型参数
已预训练完成,保存模型参数;同时选择最优评估指标来衡量算法的精度,评估系统的性能;
[0011]步骤5,微调模型:用红外图像数据集对模型进行训练和微调,得到稳定可用的模型参数,进一步提高模型的图像语义分割能力;最终使得模型对图像分割的效果更好;
[0012]步骤6,保存模型:将最终确定的模型参数进行固化,之后需要进行红外图像语义分割操作时,直接将图像输入到网络中即可得到最终的分割图像。
[0013]步骤1中所述卷积块一、卷积块二、卷积块三和卷积块四激活函数使用线性激活函数和M型激活函数,卷积块五不使用激活函数,卷积块六、卷积块七、卷积块八和卷积块九激活函数使用线性激活函数,卷积块十、卷积块十一、卷积块十二和卷积块十三激活函数使用线性激活函数;所有卷积块中卷积核的大小统一为n
×
n。最后得到特征图的大小与输入图像大小保持一致。
[0014]步骤3中所述在预训练过程中语义分割数据集使用VOC2012和CityScapes;通过对数据集中图像进行有监督的训练;对数据集的图片进行图像增强,将同一张图片进行随机衍射变换,并且裁剪到输入图片的大小,作为整个网络的输入,将数据集中做好标注的图片作为标签。
[0015]步骤4中所述在训练过程中损失函数选择交叉熵损失函数;损失函数的选择影响着模型的好坏,能够真实地体现出预测值与真值差异,并且能够正确地反馈模型的质量。
[0016]步骤4中所述在训练过程中合适的评估指标选择像素准确率,频权交并比和平均交并比,能够有效地评估算法的精度与质量,衡量分割网络的作用。
[0017]步骤5中所述在微调模型参数过程中使用FLIR数据集。
[0018]本专利技术的有益效果如下:
[0019]1、在骨干网络中使用了改进的残差网络结构,卷积块一、卷积块二、卷积块三和卷积块四采用了不同卷积核大小的卷积块对特征图进行特征提取,可以增强特征图的特征表示以及减少特征图的特征信息损失。
[0020]2、在卷积块一、卷积块二、卷积块三和卷积块四中使用M型激活函数,它是一个非单调平滑的激活函数,可以使得网络输出的图像分割精度更高,不会导致分割图像出现伪影等现象。
[0021]3、整个训练网络在两条支路上使用设计的卷积块十、卷积块十一、卷积块十二和卷积块十三进行拼接操作,可以将图像的低级特征和高级特征进行混合,使得网络对于两种不同图像的特征提取能力更强;在网络中通过添加跳跃连接有助于减少网络参数,使得网络的深度变浅,网络的参数数量较少,最终使得整个网络实现结构简单,提高分割效率和分割精度。
附图说明
[0022]图1为本专利技术一种基于U

Net的红外图像语义分割方法流程图。
[0023]图2为本专利技术一种基于U

Net的红外图像语义分割方法网络结构图。
[0024]图3为本专利技术所述卷积块一、卷积块二、卷积块三和卷积块四中每一个卷积块的具体组成。
[0025]图4为本专利技术所述卷积块十、卷积块十一、卷积块十二和卷积块十三中每一个卷积
块的具体组成。
具体实施方式
[0026]下面结合附图对本专利技术做进一步详细说明。
[0027]如图1所示,一种基于U

Net的红外图像语义分割方法,该方法具体包括如下步骤:
[0028]步骤1,构建网络模型。整个网络包括十三个卷积块,其中每个卷积块由跳跃连接、拼接操作、卷积层和激活函数组成;卷积块一、卷积块二、卷积块三和卷积块四对输入图片进行初级特征提取,卷积块五对图片中初级特征进行特征通道转换,卷积块六、卷积块七、卷积块八和卷积块九对图像中高级特征进行提取并重组,去除冗余信息,组合并保留有用信息,卷积块十、卷积块十一、卷积块十二和卷积块十三对图像使用卷积块进行拼接操作,可以将图像的低级特征和高级特征进行混合,使得网络对于两种不同图像的特征提取能力更强,得到最终的语义分割图像;卷积块一、卷积块二、卷积块三和卷积块四激活函数使用线性激活函数和M型激活函数,卷积块五不使用激活函数,卷积块六、卷积块七本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于U

Net的红外图像语义分割方法,其特征是,该方法包括如下步骤:步骤1,构建网络模型:整个网络包括十三个卷积块,其中每个卷积块由跳跃连接、拼接操作、卷积层和激活函数组成;卷积块一、卷积块二、卷积块三和卷积块四对输入图片进行初级特征提取,卷积块五对图片中初级特征进行特征通道转换,卷积块六、卷积块七、卷积块八和卷积块九对图像中高级特征进行提取并重组,去除冗余信息,组合并保留有用信息,卷积块十、卷积块十一、卷积块十二和卷积块十三对图像使用卷积块对图像进行拼接操作,可以将图像的低级特征和高级特征进行混合,使得网络对于两种不同图像的特征提取能力更强,得到最终的语义分割图像;步骤2,准备数据集:对整个卷积网络先用语义分割数据集进行训练;步骤3,训练网络模型:将步骤2中准备好的数据集输入到步骤1中构建好的网络模型中进行训练;步骤4,选择最小化损失函数和最优评估指标:通过最小化网络输出图像与标签的损失函数,直到训练次数达到设定阈值或损失函数的值到达设定范围内即可认为模型参数已预训练完成,保存模型参数;同时选择最优评估指标来衡量算法的精度,评估系统的性能;步骤5,微调模型:用红外图像数据集对模型进行训练和微调,得到稳定可用的模型参数,进一步提高模型的图像语义分割能力;最终使得模型对图像分割的效果更好;步骤6,保存模型:将最终确定的模型参数进行固化,之后需要进行红外图像语义分割操作时,直接将图像输入到网络中即可得到最终的分割图像。2.根据权利要求1所述的一种基于U

Net的红外图像语义分割方法,其特征在于,步...

【专利技术属性】
技术研发人员:詹伟达陈宇蒋一纯郭人仲郝子强
申请(专利权)人:长春理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1