一种基于非对称空间特征卷积的实时语义分割方法技术

技术编号:36226723 阅读:36 留言:0更新日期:2023-01-04 12:25
一种基于非对称空间特征卷积的实时语义分割方法,属于计算机视觉中的图像实时语义分割技术领域,为了解决现有的实时语义分割方法得到的图像精度差和分割效率低的问题,该方法首先构建网络模型;准备数据集;训练网络模型:将准备好的数据集输入到首先构建好的网络模型中进行训练;选择最小化损失函数和最优评估指标;微调模型;保存模型:将最终确定的模型参数进行固化,之后需要进行红外图像语义分割操作时,直接将图像输入到网络中即可得到最终的分割图像。该方法使语义分割得到的图像具有更好的分割效果,更符合人眼视觉观察,同时本发明专利技术提出的方法实现过程简单,图像分割效率更高,通用性更强。通用性更强。通用性更强。

【技术实现步骤摘要】
一种基于非对称空间特征卷积的实时语义分割方法


[0001]本专利技术属于计算机视觉中的图像实时语义分割
,是一种利用卷积神经网络进行语义分割的方法。

技术介绍

[0002]语义分割是根据图像本身的纹理、颜色以及场景等信息,来得出图像中每个像素所属的类别信息。在语义分割任务中,需要准确地把图像中的每一个像素分类到一个特定的类别。随着深度学习的兴起,语义分割可以提供物体在图像中的类别信息、位置信息、姿态信息以及环境信息等,在自动驾驶、增强现实、视频监控和红外图像中发挥着举足轻重的作用。然而现有的语义分割方法主要着眼于提高性能,这些算法为了提高分割的准确率,特征编码器通常会采用较为复杂的主干网络,解码器也会采用密集计算型的网络结构,所以网络模型规模很大,场景分割效率较低。但对于实际应用来说,算法需要保持较高的分割精度,同时实时性的要求也必须满足。而一些实时语义分割算法虽然速度较快,但是受局部感受野机制的限制,缺乏对场景图像中不同尺度的目标特征的充分理解,导致准确率较低。
[0003]中国专利公开号为“CN112215848A”,名称为“本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于非对称空间特征卷积的实时语义分割方法,其特征是,该方法包括如下步骤:步骤1,构建网络模型:整个网络包括卷积块一至卷积块二十六共二十六个卷积块,其中每个卷积块由跳跃连接、卷积层、激活函数和批归一化层组成;步骤2,准备数据集:对整个卷积网络先用语义分割数据集进行训练;步骤3,训练网络模型:将步骤2中准备好的数据集输入到步骤1中构建好的网络模型中进行训练;步骤4,选择最小化损失函数和最优评估指标:通过最小化网络输出图像与标签的损失函数,直到训练次数达到设定阈值或损失函数的值到达设定范围内即可认为模型参数已预训练完成,保存模型参数;同时选择最优评估指标来衡量算法的精度,评估系统的性能;步骤5,微调模型:用红外图像数据集对模型进行训练和微调,得到稳定可用的模型参数,进一步提高模型的图像语义分割能力;最终使得模型对图像分割的效果更好;步骤6,保存模型:将最终确定的模型参数进行固化,之后需要进行红外图像语义分割操作时,直接将图像输入到网络中即可得到最终的分割图像。2.根据权利要求1所述的一种基于非对称空间特征卷积的实时语义分割方法,其特征在于,所述二十六个卷积块中卷积块一、卷积块二十、卷积块二十三和卷积块二十六使用双线性插值;卷积块二、卷积块三、卷积块四、卷积块五,卷积块八、卷积块九、卷积块十、卷积块十一,卷积核的大小统一为n
×
1和1
×
n;卷积块十四、卷积块十五、卷积块十六和卷积块十七中使用了通道混洗和通道分离,卷积核的大小统一为n
×
1和1
×
n;卷积块六、卷积块七、卷积块十二、卷积块十三、卷积块十八、卷积块十九、卷积块二十一、卷积块二十二、卷积块二十四和卷积块二十五中卷积核的大小统一为n
×
n;最后得到特征图的大小与输入图像大小保持一致。3.根据权利要求1所述的一种基...

【专利技术属性】
技术研发人员:詹伟达陈宇葛微蒋一纯王佳乐
申请(专利权)人:长春理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1