当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于大卷积核骨干网络的图像语义分割方法技术

技术编号:38545410 阅读:23 留言:0更新日期:2023-08-22 20:55
本发明专利技术公开了一种基于大卷积核骨干网络的图像语义分割方法。该方法中使用由大尺寸卷积核构建的骨干网络进行特征提取,获得具有较大有效感受野的高层特征图;通过像素解码器对高层特征图进行上采样,生成多尺度高分辨率特征图,用于特征解码;特征解码器利用多尺度特征图获取图像内容信息,生成融合语义信息的查询;查询通过多层感知机生成分类预测与掩码嵌入,掩码嵌入与高分辨率特征图相乘得到掩码预测,掩码预测与分类预测相乘即可得到语义分割结果。本发明专利技术能有效地提取图像的局部信息和全局信息,帮助特征解码器获取全局语义信息,同时保留局部细节信息,显著提升了语义分割的精度。度。度。

【技术实现步骤摘要】
一种基于大卷积核骨干网络的图像语义分割方法


[0001]本专利技术属于计算机视觉技术下的图像语义分割领域,具体是一种基于大感受野骨干网络的图像语义分割方法.

技术介绍

[0002]语义分割是计算机视觉中的一个基础任务,其目标在于区分出图像中不同类别的目标并检测出对应像素的位置,经常用于图像分析、智能监控、自动驾驶等方面。虽然目前语义分割已取得非常大的进展,但受到计算机性能不足、像素级处理精度要求高等原因的限制,语义分割任务仍面临着非常大的挑战。
[0003]图像处理的任务往往需要先提取图像特征,通常是使用卷积神经网络(CNN)的方式来进行。典型的卷积神经网络通过使用许多小卷积核的堆叠来扩大每个像素点的感受野,卷积核的尺寸通常在5
×
5以内,堆叠多层后形成深度神经网络使得感受野足够大。然而,这种方法会将每个像素主要关注的信息聚集在周围较小的区域内,无法高效地利用整个感受野内的信息,有效感受野较小。对于CNN,现有的缩放方法通常关注模型深度,宽度,输入分辨率,瓶颈比率和组宽度,内核大小往往被忽略。添加大卷积核构成卷积神经网本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于大卷积核骨干网络的图像语义分割方法,其特征在于,包括以下步骤:步骤1:构建基于大卷积核骨干网络的语义分割网络;使用大卷积核的骨干网络对输入RGB图像进行特征提取,得到大感受野高层特征图,再通过像素解码器对特征图进行解码得到高分辨率特征图,并使用特征解码器对像素解码器生成的高分辨率特征图进行特征解码,最后融合像素解码器和特征解码器得到的信息生成图像语义分割的结果;步骤2:下载并处理ImageNet

22K数据集,对骨干网络部分进行预训练,得到可提取图像特征的骨干网络;步骤3:使用步骤2中训练得到的骨干网络参数,在语义分割数据集上对语义分割网络进行训练;步骤4:使用训练好的基于大卷积核骨干网络的语义分割网络对目标图像进行语义分割,得到结果准确、边缘精确的语义分割结果。2.如权利要求1所述的一种基于大卷积核骨干网络的图像语义分割方法,其特征在于,步骤1中,大卷积核骨干网络适用于语义分割模型;其中大卷积核骨干网络,先将图片输入起始层,然后将起始层的输出输入特征提取模块1

4;骨干网络的输入为将原图经过缩放操作得到的分辨率大小为H
×
W的RGB三通道图,H、W分别为经过缩放操作后得到图像的高和宽,输出为已经提取得到图像特征的特征图。3.如权利要求2所述的起始层,其特征在于,先对输入图像进行卷积核大小为3
×
3,步长为2,通道数为C1的卷积操作,将图像下采样为H/2
×
W/2的大小,再进行卷积核大小为3
×
3,步长为1,通道数为C1的DW卷积操作和卷积核大小为1
×
1,步长为1,通道数为C1的卷积操作,对低层模式进行提取,最后进行卷积核大小为3
×
3,步长为2,通道数为C1的卷积操作,将图像下采样为H/4
×
W/4的大小。4.如权利要求2所述的一种特征提取模块,其特征在于,共有4个特征提取模块,特征提取模块1

3分别包含特征提取阶段和特征图转换阶段,特征提取模块4只包含一个特征提取阶段;其中,特征提取阶段包含B个交替的大卷积核块和前馈卷积块,B值在特征提取模块1

4中分别为[2,2,18,2]。5.如权利要求4所述的大卷积核块,其特征在于,输入为起始层输出的特征图或者上一个前馈卷积块输出的特征图,先对特征图进行批归一化,再进行卷积核大小为1
×
1,步长为1的卷积操作,然后进行卷积核大小为K
×
K,步长为1的DW卷积操作,对特征图的整体信息进行提取,最后进行卷积核大小为1
×
1,步长为1的卷积操作,其中卷积核大小K值在特征提取模块1

4中分别为[31,29,27,13],将得到的特征图与输入特征图进行按元素相加,即可得到大卷积核块的输出特征图。6.如权利要求4所述的前馈卷积块,其特征在于,输入为上一个大卷积核块输出的特征图,先对输入特征图进行批归一化,然后进行卷积核大小为1
×
1,步长为1的卷积操作,将特征图的通道数增加到原通道数的4倍,再对得到的特征图进行GELU激活函数操作,最后对经过激活函数的特征图进行卷积核大小为1
×
1,步长为1的卷积操作将特征图的通道数减少到原通道数的1/4,与大卷积核块的输出特征图通道数一致,并将...

【专利技术属性】
技术研发人员:尤志强刘章杰杨静
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1