图像识别方法及装置制造方法及图纸

技术编号：25440908 阅读：69 留言：0更新日期：2020-08-28 22:28

本申请提供一种图像识别方法及装置，应用于图像处理设备，属于图像识别检索领域，所述图像处理设备预设有神经网络模型，该神经网络模型包括通道域注意力机制层和空间域注意力机制层。通过从通道域和空间域增加待识别目标关键区域的权重，使得在跟踪待识别目标的过程中，避免待识别目标尺寸变化或者待识别目标被遮挡等因素导致待识别目标被跟丢的情况。如此，使得在识别待识别目标的过程中，关注待识别目标的关键区域，获得更具鉴别性的特征，提高了神经网络模型识别和跟踪的准确率以及稳定性。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法及装置
本申请涉及图像识别检索领域，具体而言，涉及一种图像识别方法及装置。
技术介绍
图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。传统的图像识别技术的步骤包括图像获取、图像预处理、特征提取和特征识别。然而，传统的图像识别技术在目标识别，目标跟踪的过程中，由于跟踪目标的尺寸发生变化或者跟踪目标被遮挡等因素，容易导致该跟踪目标被跟丢的情况发生。
技术实现思路
为了克服现有技术中的上述不足，本申请的目的在于提供一种图像识别方法，应用于图像处理设备，所述图像处理设备预设有神经网络模型，所述神经网络模型包括至少一个特征提取层和全连接层，所述特征提取层包括第一卷积层和注意力机制层，所述注意力机制层包括空间域注意力机制层和通道域注意力机制层，所述第一卷积层的输出为所述注意力机制层的输入，所述方法的步骤包括：获取待识别图像，并将所述待识别图像输入所述至少一个特征提取层；针对每个所述特征提取层，通过所述第一卷积层获得多个通道的第一特征图像；通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重，获得空间域特征图像，所述关键区域为可以表示该待识别目标的种类的区域；通过所述通道域注意力机制层增加多个通道中的关键通道的权重，获得通道域特征图像，所述关键通道对应的第一特征图像中包含所述待识别目标的关键区域对应的特征；将所述空间域特征图像和所述通道域特征图像融合获得融合特征图像，将所述融合特征图像和所述第一特...

【技术保护点】
1.一种图像识别方法，其特征在于，应用于图像处理设备，所述图像处理设备预设有神经网络模型，所述神经网络模型包括至少一个特征提取层和全连接层，所述特征提取层包括第一卷积层和注意力机制层，所述注意力机制层包括空间域注意力机制层和通道域注意力机制层，所述第一卷积层的输出为所述注意力机制层的输入，所述方法包括：/n获取待识别图像，并将所述待识别图像输入所述至少一个特征提取层；/n针对每个所述特征提取层，通过所述第一卷积层获得多个通道的第一特征图像；/n通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重，获得空间域特征图像，所述关键区域为可以表示该待识别目标的种类的区域；/n通过所述通道域注意力机制层增加多个通道中的关键通道的权重，获得通道域特征图像，所述关键通道对应的第一特征图像中包含所述待识别目标的关键区域对应的特征；/n将所述空间域特征图像和所述通道域特征图像融合获得融合特征图像，将所述融合特征图像和所述第一特征图像融合获得第一待识别特征图像；/n通过所述全连接层学习所述第一待识别特征图像获得第二待识别特征图像；/n将所述第二待识别特征图像同预设特征库中的特征做相似...

【技术特征摘要】
1.一种图像识别方法，其特征在于，应用于图像处理设备，所述图像处理设备预设有神经网络模型，所述神经网络模型包括至少一个特征提取层和全连接层，所述特征提取层包括第一卷积层和注意力机制层，所述注意力机制层包括空间域注意力机制层和通道域注意力机制层，所述第一卷积层的输出为所述注意力机制层的输入，所述方法包括：
获取待识别图像，并将所述待识别图像输入所述至少一个特征提取层；
针对每个所述特征提取层，通过所述第一卷积层获得多个通道的第一特征图像；
通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重，获得空间域特征图像，所述关键区域为可以表示该待识别目标的种类的区域；
通过所述通道域注意力机制层增加多个通道中的关键通道的权重，获得通道域特征图像，所述关键通道对应的第一特征图像中包含所述待识别目标的关键区域对应的特征；
将所述空间域特征图像和所述通道域特征图像融合获得融合特征图像，将所述融合特征图像和所述第一特征图像融合获得第一待识别特征图像；
通过所述全连接层学习所述第一待识别特征图像获得第二待识别特征图像；
将所述第二待识别特征图像同预设特征库中的特征做相似度计算，获得计算结果，根据所述计算结果判断所述待识别目标的目标种类，并将所述目标种类对应的图像和所述待识别图像进行匹配，其中，所述预设特征库中的特征通过训练好的所述神经网络模型学习已知目标种类的图像获得。

2.根据权利要求1所述的图像识别方法，其特征在于，所述注意力机制层还包括维度调整层，将所述融合特征和所述第一特征图像融合获得第一待识别特征之前还包括步骤：
通过所述维度调整层调整所述融合特征的维度，使得调整后的融合特征与所述第一特征图像具有相同维度，其中，所述维度表示特征特征图像的尺寸和通道。

3.根据权利要求2所述的图像识别方法，其特征在于，所述空间域注意力机制层包括至少一个第二卷积层，所述通过所述空间域注意力机制层增加所述第一特征图像中待识别目标的关键区域的权重，获得空间域特征图像的步骤包括：
将所述多个通道的第一特征图像融合成单个通道的空间域待处理图像；
通过所述至少一个第二卷积层对所述空间域待处理图像进行处理获得所述空间域特征图像。

4.根据权利要求2所述的图像识别方法，其特征在于，所述通道域注意力机制层包括至少一个第三卷积层，所述通过所述通道域注意力机制层增加多个通道中的关键通道的权重，获得通道域特征图像的步骤包括：
计算每一个通道的第一特征图像的像素平均值，进而获得通道域待处理图像；
通过所述至少一个第三卷积层对所述通道域待处理图像进行处理获得所述通道域特征图像。

5.根据权利要求1所述的图像识别方法，其特征在于，所述方法的步骤还包括对所述神经网络模型的训练：
通过预设参数对神经网络进行初始化；
获取训练样本集，所述训练样本集包括多个正负样本对，所述正负样本对包括预设数量的目标图像和预设数量的非目标图像；
将所述训练样本集送入神经网络模型，通过预设损失函数根据反向传播算...

【专利技术属性】
技术研发人员：张顺丰，陈志超，毛河，高枫，
申请(专利权)人：成都通甲优博科技有限责任公司，
类型：发明
国别省市：四川;51

全部详细技术资料下载我是这个专利的主人