一种空间和通道加权和动态非对称卷积的物体识别方法技术

技术编号:37477734 阅读:26 留言:0更新日期:2023-05-07 09:19
本发明专利技术公开了一种空间和通道加权和动态非对称卷积的物体识别方法,本发明专利技术通过提出的非对称卷积组对平方卷积进行重构,加强卷积局部信息与全局信息的内在联系,使得网络获得3个不同卷积部位的特征,增强模型学习能力。其中,非对称卷积组针对平方卷积的骨干部分进行重构,增加卷积对局部显著特征的捕获。这种局部显著信息能够帮助模型更好的获得物体特征上下文语义信息,提高模型对物体识别准确率。提高模型对物体识别准确率。提高模型对物体识别准确率。

【技术实现步骤摘要】
一种空间和通道加权和动态非对称卷积的物体识别方法


[0001]本专利技术属于图像识别领域。具体涉及一种基于空间信息分析与特征通道加权方法改进的卷积神经网络模型。

技术介绍

[0002]图像是人类感知事物的视觉基础,人们可以通过图像从外界获得重要信息,因此让机器自动完成图像识别、分类具有重要意义。在图像领域,高效的特征提取算法是主要的研究方向之一,特征提取技术的发展有助于图像分类性能的提升。深度学习算法在图像分类方面的应用已经取得突破性进展。它通过建立、模拟人脑的分层结构,对外部输入的声音、图像、文本等数据进行特征提取,获取低维和高维的特征表示,从中得到表征能力更强的特征。所以深度学习在图像分类领域具有广阔的应用空间,尤其是卷积神经网络。这种网络是一种广泛被使用的深度学习模型,其优点是能够直接对图像像素进行卷积,从图像像素中提取图像特征。另外,卷积神经网络的权值共享属性和池化层使网络重待训练的参数量减少,简化网络模型,提高训练的效率。然而,当前流行的深度网络都具有相同的静态推理范式:一旦完成训练,网络的结构与参数在测试阶段都保持不变,对不同图像做本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种空间和通道加权和动态非对称卷积的物体识别方法,其特征在于,该方法具体包括以下步骤:步骤1:输入图像,并对图像进行预处理,得到预处理后的图像I;步骤2:通过改进ResNet网络结构获取新的特征图步骤2

1:改进后的ResNet网络结构中的卷积层使用全局平均池化层压缩图像I的全局空间信息,然后先后经过一层全连接层和激活函数ReLu获得初步的注意力信息G;步骤2

2:将注意力信息G分别经过通道全连接层和空间全连接层,计算出空间和通道注意力权重;步骤2

3:空间注意力将平方卷积与非对称卷积组进行聚合;首先使用零填充的方法将非对称卷积组中的卷积等价转换成3x 3卷积;然后3个卷积核分别与其对应的空间注意力权重加权;最后进行叠加得到新的卷积核参数若需要使用偏置,则设置3个偏置值分别对应一个平方卷积、一个3x 1卷积和一个1x 3卷积;这些偏置值与其对应卷积的空间注意力参数进行聚合获得新偏置值步骤2

4:通道注意力通过乘法逐通道加权到最开始的图像I得到新的特征图步骤3:特征提取卷积核参数和偏置值组成新的卷积层L,特征图经过卷积层L进行特征提取,获得最后的特征输出。2.根据权利要求1所述的一种空间和通道加权和动态非对称卷积的物体识别方法,其特征在于:步骤1中所诉的注意力解码层在传统SENet模块的基础上改进注意力生成方式,一共包含三个全连接层,具体为:所述的原SENet模块计算公式如下:F
sq
为全局平均池化卷积,I为输入图像,F
ex
为一个全链接层和ReLU激活函数,为通道注意力;此外,动态非对称卷积方法使用两个全连接层生成两种注意力,具体定义如下:G=F
ex
(F
sq
(I))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)π=f(f
k
(G)/t)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)f
c
和f
k
分别是通道和空间全连接层,f表示Softmax激活函数,π={π1,π2,π3}为空间注意力,t表示退火机制中的温度。3.根据权利要求1所述的一种空间和通道加权和动态非对称卷积的物体识别方法,其特征在于:计算空间注意力权重时通过Softmax函数对空间注意力的输出进行归一化,以促进空间注意力的学习;对空间注...

【专利技术属性】
技术研发人员:陈滨王秦科邵艳利魏丹王兴起方景龙
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1