图像识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:21893106 阅读:56 留言:0更新日期:2019-08-17 14:58
本申请涉及一种图像识别方法、装置、计算机设备和存储介质,所述方法包括:通过计算机设备获取待处理图像;采用预设的识别模型对所述待处理图像进行特征提取,得到识别向量;所述识别模型为采用注意力机制,且采用密集损失函数进行训练所得到的模型,所述识别向量用于表征所述待处理图像的多个局部特征;对所述识别向量进行图像识别,得到识别结果。采用该方法极大的提高了对存在遮挡或者大角度拍摄等情况的图像识别的准确性。

Image recognition methods, devices, computer equipment and storage media

【技术实现步骤摘要】
图像识别方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种图像识别方法、装置、计算机设备和存储介质。
技术介绍
随着科学技术的快速发展,人工智能技术已经广泛的应用于人们的生活和工作中,其中,尤其对于图像的识别和处理已经有了不可替代的地位。以人脸图像识别为例,计算机设备可以采用传统的神经网络模型,对人脸图像进行识别,从而得到人脸图像的全脸特征。然而,传统的神经网络模型是针对人脸图像的全脸特征进行识别,当人脸存在局部遮挡,或者大角度进行拍摄的时候,可能存在识别结果不准确的情况。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高图像识别准确度的图像识别方法、装置、计算机设备和存储介质。第一方面,本申请实施例提供一种图像识别方法,所述方法包括:获取待处理图像;采用预设的识别模型对所述待处理图像进行特征提取,得到识别向量;所述识别模型为采用注意力机制,且采用密集损失函数进行训练所得到的模型,所述识别向量用于表征所述待处理图像的多个局部特征;对所述识别向量进行图像识别,得到识别结果。在其中一个实施例中,所述识别模型包括基础特征提取网络、局部特征划分单元和注意力单元;所述采用预设的识别模型对所述待处理图像进行识别,得到识别向量,包括:采用所述基础特征提取网络对所述待处理图像进行特征提取,得到综合特征图;采用所述局部特征划分单元对所述综合特征图进行处理,得到多个局部特征图;采用所述注意力单元对所述综合特征图和所述多个局部特征图进行处理,并通过全连接层输出所述识别向量。在其中一个实施例中,所述采用所述注意力单元对所述综合特征图和所述多个局部特征图进行处理,并通过全连接层输出所述识别向量,包括:采用所述注意力单元对所述综合特征图进行处理,得到注意力图;将多个所述局部特征图和所述注意力图进行融合处理,通过全连接层输出所述识别向量。在其中一个实施例中,所述将多个所述局部特征图和所述注意力图进行融合处理,通过全连接层输出所述识别向量,包括:将每个所述局部特征图分别与所述注意力图相乘,得到每个所述局部特征图对应的加权特征向量;将多个所述加权特征向量串联,并通过所述全连接层输出所述识别向量。在其中一个实施例中,所述采用预设的识别模型对所述待处理图像进行识别,得到识别向量之前,包括:将多个训练图像输入预设的初始识别模型,得到多个局部训练特征图和训练注意力图;使用所述训练注意力图对所述多个局部训练特征图进行加权处理,得到加权局部训练特征图;根据每个所述加权局部训练特征图,和对应的每个所述训练图像的标注信息之间的密集损失函数,对所述初始识别模型进行训练,得到所述识别模型;所述密集损失函数中包括多个分类损失函数,每个所述分类损失函数对应图像不同的局部区域。在其中一个实施例中,所述采用预设的识别模型对所述待处理图像进行识别,得到识别向量之前,包括:将多个训练图像输入预设的初始识别模型,得到多个局部训练特征图、训练注意力图和初始识别向量;使用所述训练注意力图对所述多个局部训练特征图进行加权处理,得到加权局部训练特征图;根据每个所述加权局部训练特征图,和对应的每个所述训练图像的标注信息之间的密集损失函数,以及根据所述初始识别向量和所述训练图像的标注信息之间的损失函数,对所述初始识别模型进行训练,得到所述识别模型;所述密集损失函数中包括多个分类损失函数,每个所述分类损失函数对应图像不同的局部区域;所述初始识别向量为所述多个加权局部训练特征图进行融合处理所输出的向量。在其中一个实施例中,所述注意力图的长度和宽度相同。第二方面,本申请实施例提供一种图像识别装置,所述装置包括:获取模块,用于获取待处理图像;识别模块,用于采用预设的识别模型对所述待处理图像进行特征提取,得到识别向量;所述识别模型为采用注意力机制,且采用密集损失函数进行训练所得到的模型,所述识别向量用于表征所述待处理图像的多个局部特征;分类模块,用于对所述识别向量进行图像识别,得到识别结果。第三方面,本申请实施例提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取待处理图像;采用预设的识别模型对所述待处理图像进行特征提取,得到识别向量;所述识别模型为采用注意力机制,且采用密集损失函数进行训练所得到的模型,所述识别向量用于表征所述待处理图像的多个局部特征;对所述识别向量进行图像识别,得到识别结果。第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取待处理图像;采用预设的识别模型对所述待处理图像进行特征提取,得到识别向量;所述识别模型为采用注意力机制,且采用密集损失函数进行训练所得到的模型,所述识别向量用于表征所述待处理图像的多个局部特征;对所述识别向量进行图像识别,得到识别结果。上述图像识别方法、装置、计算机设备和存储介质,通过计算机设备获取待处理图像,并采用预设的识别模型对待处理图像进行特征提取,得到识别向量,之后计算机设备再对识别向量进行图像识别,得到识别结果。由于识别模型为采用注意力机制,且采用密集损失函数进行训练所得到的模型,因此识别模型能够将上述待处理图像的多个局部区域分别进行重点和精确地特征提取,并通过注意力机制对每个局部特征的识别结果配置相应的权重,从而得到表征待处理图像的多个局部特征的识别向量,最后通过对识别向量进行图像识别得到识别结果,进而弱化了遮挡区域在识别结果中的影响,避免了由于局部图像不完整所导致的识别结果不准确的情况。采用该方法,极大地提高了对存在局部遮挡或者大角度拍摄等情况下的图像识别的准确性。另外,由于上述识别模型是经过密集损失函数训练所得到的模型,即为采用多个损失函数分别对待处理图像的多个不同区域对应的网络参数进行训练得到的,因此针对待处理图像的各局部区域的特征提取更精确,进而使得识别模型输出的识别向量的准确度大大提高,识别结果的准确性也大大提高。附图说明图1为一个实施例中计算机设备的内部结构图;图2为一个实施例提供的图像识别方法的流程示意图;图3为另一个实施例提供的图像识别方法的流程示意图;图4为又一个实施例提供的图像识别方法的流程示意图;图5为又一个实施例提供的图像识别方法的流程示意图;图5a为一个实施例提供的识别模型的网络结构图;图6为又一个实施例提供的图像识别方法的流程示意图;图7为一个实施例提供的图像识别装置的结构示意图;图8为另一个实施例提供的图像识别装置的结构示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请实施例提供的图像识别方法,可以适用于图1所示的计算机设备。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、数据库、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储下述实施例中的识别模型,有关识别模本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,所述方法包括:获取待处理图像;采用预设的识别模型对所述待处理图像进行特征提取,得到识别向量;所述识别模型为采用注意力机制,且采用密集损失函数进行训练所得到的模型,所述识别向量用于表征所述待处理图像的多个局部特征;对所述识别向量进行图像识别,得到识别结果。

【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:获取待处理图像;采用预设的识别模型对所述待处理图像进行特征提取,得到识别向量;所述识别模型为采用注意力机制,且采用密集损失函数进行训练所得到的模型,所述识别向量用于表征所述待处理图像的多个局部特征;对所述识别向量进行图像识别,得到识别结果。2.根据权利要求1所述的方法,其特征在于,所述识别模型包括基础特征提取网络、局部特征划分单元和注意力单元;所述采用预设的识别模型对所述待处理图像进行识别,得到识别向量,包括:采用所述基础特征提取网络对所述待处理图像进行特征提取,得到综合特征图;采用所述局部特征划分单元对所述综合特征图进行处理,得到多个局部特征图;采用所述注意力单元对所述综合特征图和所述多个局部特征图进行处理,并通过全连接层输出所述识别向量。3.根据权利要求2所述的方法,其特征在于,所述采用所述注意力单元对所述综合特征图和所述多个局部特征图进行处理,并通过全连接层输出所述识别向量,包括:采用所述注意力单元对所述综合特征图进行处理,得到注意力图;将多个所述局部特征图和所述注意力图进行融合处理,通过全连接层输出所述识别向量。4.根据权利要求3所述的方法,其特征在于,所述将多个所述局部特征图和所述注意力图进行融合处理,通过全连接层输出所述识别向量,包括:将每个所述局部特征图分别与所述注意力图相乘,得到每个所述局部特征图对应的加权特征向量;将多个所述加权特征向量串联,并通过所述全连接层输出所述识别向量。5.根据权利要求1至4任一项所述的方法,其特征在于,所述采用预设的识别模型对所述待处理图像进行识别,得到识别向量之前,包括:将多个训练图像输入预设的初始识别模型,得到多个局部训练特征图和训练注意力图;使用所述训练注意力图对所述多个局部训练特征图进行加权处理,得到加权局部训练特征图;根据每个...

【专利技术属性】
技术研发人员:李栋
申请(专利权)人:北京旷视科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1