基于图注意力网络的多标签图像识别方法技术

技术编号:28713986 阅读:32 留言:0更新日期:2021-06-06 01:13
本发明专利技术为一种基于图注意力网络的多标签图像识别方法,包括:第一步,待识别的多标签图像经过卷积神经网络输入层的预处理后进入卷积神经网络,利用全局共现特征提取模块提取共现特征矩阵;第二步,利用待识别的多标签图像的标签节点之间的条件概率,构建标签节点之间的邻接矩阵;第三步,将邻接矩阵作为图注意力网络的输入,经过图注意力网络学习得到学习后的矩阵;第四步,将共现特征矩阵与学习后的矩阵进行线性相乘,得到识别结果。该方法利用全局共现特征提取模块提取图像中的共现特征矩阵,提取图像全局共现特征与总体信息;通过图注意力网络的注意力机制计算标签节点之间的关联性,对每个标签节点自适应分配不同的权重,有利于提高识别精度。有利于提高识别精度。有利于提高识别精度。

【技术实现步骤摘要】
基于图注意力网络的多标签图像识别方法


[0001]本专利技术涉及计算机图像处理领域,具体是一种基于图注意力网络的多标签图像识别方法。

技术介绍

[0002]图像识别技术能够代替人力去处理大量繁多复杂的图像,图像识别被广泛应用于多个领域,如医学诊断、智能图像管理、相册搜索等。
[0003]在众多的图像信息处理中,图像识别实际上是一个分类的过程,即寻找识别出图像中固有的特征,使其区分于其他不同类别的图像而归类,这就要求所选取的特征为最具有区别性的特征,最具有区别性的特征可以很好地区分于不同类别的图像,同时该特征可以形象地描述图像,即选取拥有较小的类内距的同时尽量拥有较大的类间距的图像特征,这些特征在同类图像之间差异较小,在不同类别的图像之间差异较大。
[0004]随着卷积神经网络(CNNs)的出现,图像识别的整体性能得到了极大的提高。CNNs中的卷积层主要利用一定规格的滤波器实现空间特征的提取,即对各个像素点及其相邻像素点进行加权求和的运算来构造特征图。CNNs一般具有输入层、卷积层、激活层、池化层、输出层五个层级结构。其中,对图像本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图注意力网络的多标签图像识别方法,其特征在于,该方法包括以下步骤:第一步,待识别的多标签图像经过卷积神经网络输入层的预处理后进入到卷积神经网络中,利用全局共现特征提取模块提取共现特征矩阵X;全局共现特征提取模块包括压缩和扩充两个过程;第二步,利用待识别的多标签图像的标签节点之间的条件概率,构建标签节点之间的邻接矩阵A;第三步,将邻接矩阵A作为图注意力网络的输入,经过图注意力网络学习得到矩阵A

;第四步,按照式(7)将第一步得到的共现特征矩阵X与第三步得到的矩阵A

进行线性相乘,得到预测值即识别结果;通过上述第一步至第四步完成多标签图像的识别。2.根据权利要求1所述的基于图注意力网络的多标签图像识别方法,其特征在于,第一步中全局共现特征提取模块的具体过程为:设全局共现特征提取模块的初始输入为大小为h
×
w
×
c的3D张量,h代表空间高度,w代表空间宽度,c为通道数;全局共现特征提取模块的初始输入经过卷积操作,得到矩阵N;设N
T
为矩阵N的转置矩阵,常量q=h
×
w,I是大小为q
×
q的单位矩阵,J是大小为q
×
q的全1矩阵,变换矩阵利用式(1)计算协方差矩阵K;对协方差矩阵K进行标准化,得到标准化后的协方差矩阵K

,至...

【专利技术属性】
技术研发人员:班晓晓申伟昊韩锦恒向顺许乾剑张记龙郭世杰王元全
申请(专利权)人:河北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1