图像识别方法及装置制造方法及图纸

技术编号:25440908 阅读:69 留言:0更新日期:2020-08-28 22:28
本申请提供一种图像识别方法及装置,应用于图像处理设备,属于图像识别检索领域,所述图像处理设备预设有神经网络模型,该神经网络模型包括通道域注意力机制层和空间域注意力机制层。通过从通道域和空间域增加待识别目标关键区域的权重,使得在跟踪待识别目标的过程中,避免待识别目标尺寸变化或者待识别目标被遮挡等因素导致待识别目标被跟丢的情况。如此,使得在识别待识别目标的过程中,关注待识别目标的关键区域,获得更具鉴别性的特征,提高了神经网络模型识别和跟踪的准确率以及稳定性。

【技术实现步骤摘要】
图像识别方法及装置
本申请涉及图像识别检索领域,具体而言,涉及一种图像识别方法及装置。
技术介绍
图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。传统的图像识别技术的步骤包括图像获取、图像预处理、特征提取和特征识别。然而,传统的图像识别技术在目标识别,目标跟踪的过程中,由于跟踪目标的尺寸发生变化或者跟踪目标被遮挡等因素,容易导致该跟踪目标被跟丢的情况发生。
技术实现思路
为了克服现有技术中的上述不足,本申请的目的在于提供一种图像识别方法,应用于图像处理设备,所述图像处理设备预设有神经网络模型,所述神经网络模型包括至少一个特征提取层和全连接层,所述特征提取层包括第一卷积层和注意力机制层,所述注意力机制层包括空间域注意力机制层和通道域注意力机制层,所述第一卷积层的输出为所述注意力机制层的输入,所述方法的步骤包括:获取待识别图像,并将所述待识别图像输入所述至少一个特征提取层;针对每个所述特征提取层,通过所述第一卷积层获得多个通道的第一特征图像;通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重,获得空间域特征图像,所述关键区域为可以表示该待识别目标的种类的区域;通过所述通道域注意力机制层增加多个通道中的关键通道的权重,获得通道域特征图像,所述关键通道对应的第一特征图像中包含所述待识别目标的关键区域对应的特征;将所述空间域特征图像和所述通道域特征图像融合获得融合特征图像,将所述融合特征图像和所述第一特征图像融合获得第一待识别特征图像;通过所述全连接层学习所述第一待识别特征图像获得第二待识别特征图像;将所述第二待识别特征图像同预设特征库中的特征做相似度计算,获得计算结果,根据所述计算结果判断所述待识别目标的目标种类,并将所述目标种类对应的图像和所述待识别图像进行匹配,其中,所述预设特征库中的特征通过训练好的所述神经网络模型学习已知目标种类的图像获得。可选地,所述注意力机制层还包括维度调整层,将所述融合特征和所述第一特征图像融合获得第一待识别特征之前还包括步骤:通过所述维度调整层调整所述融合特征的维度,使得调整后的融合特征与所述第一特征图像具有相同维度,其中,所述维度表示特征特征图像的尺寸和通道。可选地,所述空间域注意力机制层包括至少一个第二卷积层,所述通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重,获得空间域特征图像的步骤包括:将所述多个通道的第一特征图像融合成单个通道的空间域待处理图像;通过所述至少一个第二卷积层对所述空间域待处理图像进行处理获得所述空间域特征图像。可选地,所述通道域注意力机制层包括至少一个第三卷积层,所述通过所述通道域注意力机制层增加多个通道中的关键通道的权重,获得通道域特征图像的步骤包括:计算每一个通道的第一特征图像的像素平均值,进而获得通道域待处理图像;通过所述至少一个第三卷积层对所述通道域待处理图像进行处理获得所述通道域特征图像。可选地,所述方法的步骤还包括对所述神经网络模型的训练:通过预设参数对神经网络进行初始化;获取训练样本集,所述训练样本集包括多个正负样本对,所述正负样本对包括预设数量的目标图像和预设数量的非目标图像;将所述训练样本集送入神经网络模型,通过预设损失函数根据反向传播算法多次调整所述神经网络模型的权值,直到所述预设损失函数的误差低于预设阈值。可选地,所述预设损失函数为Softmax损失函数和Triplet损失函数。本申请的另一目的在于提供一种图像识别装置,应用于图像处理设备,所述图像处理设备预设有神经网络模型,所述神经网络模型包括至少一个特征提取层和全连接层,所述特征提取层包括第一卷积层和注意力机制层,所述注意力机制层包括空间域注意力机制层和通道域注意力机制层,所述第一卷积层的输出为所述注意力机制层的输入,所述图像识别装置包括图像获取模块、特征提取模块、空间域模块、通道域模块、融合模块、全连接模块和匹配模块;所述图像获取模块用于获取待识别图像,并将所述待识别图像输入所述至少一个特征提取层;所述特征提取模块用于针对每个所述特征提取层,通过所述第一卷积层获得多个通道的第一特征图像;所述空间域模块用于通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重,获得空间域特征图像,所述关键区域为可以表示该待识别目标的种类的区域;所述通道域模块用于通过所述通道域注意力机制层增加多个通道中的关键通道的权重,获得通道域特征图像,所述关键通道对应的第一特征图像中包含所述待识别目标的关键区域对应的特征;所述融合模块用于将所述空间域特征图像和所述通道域特征图像融合获得融合特征图像,将所述融合特征图像和所述第一特征图像融合获得第一待识别特征图像;所述全连接模块用于通过所述全连接层学习所述第一待识别特征图像获得第二待识别特征图像;所述匹配模块用于将所述第二待识别特征图像同预设特征库中的特征做相似度计算,获得计算结果,根据所述计算结果判断所述待识别目标的目标种类,并将所述目标种类对应的图像和所述待识别图像进行匹配,其中,所述预设特征库中的特征通过训练好的所述神经网络模型学习已知目标种类的图像获得。可选地,所述注意力机制层还包括维度调整层,所述图像是被装安置还包括维度调整模块,所述维度调整模块通过以下方式进行维度调整:通过所述维度调整层调整所述融合特征的维度,使得调整后的融合特征与所述第一特征图像具有相同维度,其中,所述维度表示特征特征图像的尺寸和通道。可选地,所述空间域注意力机制层包括至少一个第二卷积层,所述空间域模块通过以下方式获得空间域特征图像:将所述多个通道的第一特征图像融合成单个通道的空间域待处理图像;通过所述至少一个第二卷积层对所述空间域待处理图像进行处理获得所述空间域特征图像。可选地,所述通道域注意力机制层包括至少一个第三卷积层,所述通道域模块通过以下方式获得通道域特征图像:计算每一个通道的第一特征图像的像素平均值,进而获得通道域待处理图像;通过所述至少一个第三卷积层对所述通道域待处理图像进行处理获得所述通道域特征图像。相对于现有技术而言,本申请具有以下有益效果:本申请实施例提供一种图像识别方法及装置,应用于图像处理设备,属于图像识别检索领域,所述图像处理设预设有神经网络模型,该神经网络模型包括通道域注意力机制层和空间域注意力机制层。通过从通道域和空间域增加待识别目标关键区域的权重,使得在跟踪待识别目标的过程中,避免待识别目标尺寸变化或者待识别目标被遮挡等因素导致该待识别目标被跟丢的情况。如此,使得在识别待识别目标的过程中,关注待识别目标的关键区域,获得更具鉴别性的特征,提高了神经网络模型识别和跟踪的准确率以及稳定性。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,应用于图像处理设备,所述图像处理设备预设有神经网络模型,所述神经网络模型包括至少一个特征提取层和全连接层,所述特征提取层包括第一卷积层和注意力机制层,所述注意力机制层包括空间域注意力机制层和通道域注意力机制层,所述第一卷积层的输出为所述注意力机制层的输入,所述方法包括:/n获取待识别图像,并将所述待识别图像输入所述至少一个特征提取层;/n针对每个所述特征提取层,通过所述第一卷积层获得多个通道的第一特征图像;/n通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重,获得空间域特征图像,所述关键区域为可以表示该待识别目标的种类的区域;/n通过所述通道域注意力机制层增加多个通道中的关键通道的权重,获得通道域特征图像,所述关键通道对应的第一特征图像中包含所述待识别目标的关键区域对应的特征;/n将所述空间域特征图像和所述通道域特征图像融合获得融合特征图像,将所述融合特征图像和所述第一特征图像融合获得第一待识别特征图像;/n通过所述全连接层学习所述第一待识别特征图像获得第二待识别特征图像;/n将所述第二待识别特征图像同预设特征库中的特征做相似度计算,获得计算结果,根据所述计算结果判断所述待识别目标的目标种类,并将所述目标种类对应的图像和所述待识别图像进行匹配,其中,所述预设特征库中的特征通过训练好的所述神经网络模型学习已知目标种类的图像获得。/n...

【技术特征摘要】
1.一种图像识别方法,其特征在于,应用于图像处理设备,所述图像处理设备预设有神经网络模型,所述神经网络模型包括至少一个特征提取层和全连接层,所述特征提取层包括第一卷积层和注意力机制层,所述注意力机制层包括空间域注意力机制层和通道域注意力机制层,所述第一卷积层的输出为所述注意力机制层的输入,所述方法包括:
获取待识别图像,并将所述待识别图像输入所述至少一个特征提取层;
针对每个所述特征提取层,通过所述第一卷积层获得多个通道的第一特征图像;
通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重,获得空间域特征图像,所述关键区域为可以表示该待识别目标的种类的区域;
通过所述通道域注意力机制层增加多个通道中的关键通道的权重,获得通道域特征图像,所述关键通道对应的第一特征图像中包含所述待识别目标的关键区域对应的特征;
将所述空间域特征图像和所述通道域特征图像融合获得融合特征图像,将所述融合特征图像和所述第一特征图像融合获得第一待识别特征图像;
通过所述全连接层学习所述第一待识别特征图像获得第二待识别特征图像;
将所述第二待识别特征图像同预设特征库中的特征做相似度计算,获得计算结果,根据所述计算结果判断所述待识别目标的目标种类,并将所述目标种类对应的图像和所述待识别图像进行匹配,其中,所述预设特征库中的特征通过训练好的所述神经网络模型学习已知目标种类的图像获得。


2.根据权利要求1所述的图像识别方法,其特征在于,所述注意力机制层还包括维度调整层,将所述融合特征和所述第一特征图像融合获得第一待识别特征之前还包括步骤:
通过所述维度调整层调整所述融合特征的维度,使得调整后的融合特征与所述第一特征图像具有相同维度,其中,所述维度表示特征特征图像的尺寸和通道。


3.根据权利要求2所述的图像识别方法,其特征在于,所述空间域注意力机制层包括至少一个第二卷积层,所述通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重,获得空间域特征图像的步骤包括:
将所述多个通道的第一特征图像融合成单个通道的空间域待处理图像;
通过所述至少一个第二卷积层对所述空间域待处理图像进行处理获得所述空间域特征图像。


4.根据权利要求2所述的图像识别方法,其特征在于,所述通道域注意力机制层包括至少一个第三卷积层,所述通过所述通道域注意力机制层增加多个通道中的关键通道的权重,获得通道域特征图像的步骤包括:
计算每一个通道的第一特征图像的像素平均值,进而获得通道域待处理图像;
通过所述至少一个第三卷积层对所述通道域待处理图像进行处理获得所述通道域特征图像。


5.根据权利要求1所述的图像识别方法,其特征在于,所述方法的步骤还包括对所述神经网络模型的训练:
通过预设参数对神经网络进行初始化;
获取训练样本集,所述训练样本集包括多个正负样本对,所述正负样本对包括预设数量的目标图像和预设数量的非目标图像;
将所述训练样本集送入神经网络模型,通过预设损失函数根据反向传播算...

【专利技术属性】
技术研发人员:张顺丰陈志超毛河高枫
申请(专利权)人:成都通甲优博科技有限责任公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1