图像识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：25950664 阅读：20 留言：0更新日期：2020-10-17 03:42

本公开实施例提供的图像识别方法、装置、电子设备及存储介质，通过获取的待识别图像的图像数据；将待识别图像的图像数据输入至卷积神经网络模型，输出待识别图像对应的人体关键点的热力图，以及手部距离图；根据所述人体关键点的热力图和手部距离图，确定待识别图像中手部包围矩形所在的图像区域；输出包括图像区域的图像识别结果。本公开不再依赖于对图像像素进行检测以确定图像识别结果，而是通过利用人体关键点的热力图以及手部距离图，确定并输出包括手部包围矩形所在的图像区域的图像识别结果，对于各类图像中的手部的图像识别均有着很好的适应性，且由于利用了卷积神经网络模型进行识别处理，也能够对于识别的准确率进行有效保证。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法、装置、电子设备及存储介质
本公开实施例涉及图像处理领域，尤其涉及一种图像识别方法、装置、电子设备及存储介质。
技术介绍
对图像进行物体类型识别是图像跟踪技术中必不可缺的环节。相关技术中，对于图像中物体的识别，一般可基于像素检测技术实现。通过对于像素进行聚类，并判断每一聚类像素所归属的物体，进而可确定每个物体在图像中的图像位置。但是，在利用相似检测技术对于手部进行识别或手部跟踪的过程中，专利技术人发现其实现方式至少存在以下缺陷：在手部距离图像采集点较远的场景下，手部在图像中所占的像素数较少，这使得在对图像中的像素进行聚类时，手部的像素容易被聚类到其他物体的聚类中，导致在图像中无法确定手部的图像位置的问题，影响其图像位置在后续定位中的使用。
技术实现思路
针对上述问题，本公开实施例提供了一种图像识别方法、装置、电子设备及存储介质。第一方面，本公开实施例提供一种图像识别方法，包括：获取的待识别图像的图像数据；将所述待识别图像的图像数据输入至卷积神经网络模型，输出待识别图像对应的人体关键点的热力图，以及手部距离图；其中，手部距离图用于表示手部预测包围矩形上每一条边到手部预测中心点的距离；根据所述人体关键点的热力图和手部距离图，确定待识别图像中手部包围矩形所在的图像区域；输出包括所述图像区域的图像识别结果。第二方面，本公开实施例提供一种图像识别装置，包括：获取模块，用于获取的待识别图像的图像数据；识别模块，用于将所述待识别图像的图...

【技术保护点】
1.一种图像识别方法，其特征在于，包括：/n获取的待识别图像的图像数据；/n将所述待识别图像的图像数据输入至卷积神经网络模型，输出待识别图像对应的人体关键点的热力图，以及手部距离图；其中，手部距离图用于表示手部预测包围矩形上每一条边到手部预测中心点的距离；/n根据所述人体关键点的热力图和手部距离图，确定待识别图像中手部包围矩形所在的图像区域；/n输出包括所述图像区域的图像识别结果。/n

【技术特征摘要】
1.一种图像识别方法，其特征在于，包括：
获取的待识别图像的图像数据；
将所述待识别图像的图像数据输入至卷积神经网络模型，输出待识别图像对应的人体关键点的热力图，以及手部距离图；其中，手部距离图用于表示手部预测包围矩形上每一条边到手部预测中心点的距离；
根据所述人体关键点的热力图和手部距离图，确定待识别图像中手部包围矩形所在的图像区域；
输出包括所述图像区域的图像识别结果。

2.根据权利要求1所述的图像识别方法，其特征在于，所述根据所述人体关键点的热力图和手部距离图，确定待识别图像中手部包围矩形所在的图像区域，包括：
根据所述人体关键点的热力图，确定手部中心关键点在待识别图像中的图像坐标；
根据所述手部中心关键点的图像坐标以及手部距离图，确定所述手部包围矩形在所述待识别图像中的图像坐标，得到所述手部包围矩形所在的图像区域。

3.根据权利要求2所述的图像识别方法，其特征在于，所述根据所述人体关键点的热力图，确定手部中心关键点在待识别图像中的图像坐标，包括：
根据所述人体关键点热力图中手部中心关键点的高斯概率分布中概率值最大的点的图像坐标，作为手部中心关键点的图像坐标。

4.根据权利要求2所述的图像识别方法，其特征在于，所述根据所述手部中心关键点的图像坐标以及手部距离图，确定所述手部包围矩形在所述待识别图像中的图像坐标，包括：
根据所述手部距离图中的手部包围矩形上每一条边到手部中心关键点的各距离，确定所述手部中心关键点到手部包围矩形的每条矩形四条边的距离；
根据所述手部中心关键点的图像坐标,以及所述手部中心关键点到手部包围矩形的每条矩形四条边的各距离，确定所述手部包围矩形在所述待识别图像中的图像坐标。

5.根据权利要求1-4任一项所述的图像识别方法，其特征在于，还包括：
建立待训练的卷积神经网络模型，获得训练样本图像，其中，所训练样本图像包括样本图像数据，对所述训练样本图像进行标注获得的人体关键点和手部包围矩形；
将所述训练样本图像中的样本图像数据作为待训练的卷积神经网络模型的输入，将标注获得的人体关键点所形成的人体关键点的热力图以及标注获得的手部包围矩形作为训练目标，对所述待训练的卷积神经网络模型进行训练，获得所述训练完毕的卷积神经网络模型。

6.一种图像识别装置，其特征在于，包括：
获取模块，用于获取的待识别图像的图像数据；
识别模块，用于将所...

【专利技术属性】
技术研发人员：卢艺帆，
申请(专利权)人：北京字节跳动网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人