图像识别方法、装置及系统制造方法及图纸

技术编号：19343533 阅读：25 留言：0更新日期：2018-11-07 14:24

本发明专利技术提供了一种图像识别方法、装置及系统，涉及图像识别技术领域，该方法包括：获取待识别图像；将待识别图像输入至卷积神经网络模型；其中，卷积神经网络模型包括平移不变形的残差金字塔模块、沙漏模块和级联特征金字塔模块；通过卷积神经网络模型中的残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对待识别图像进行特征提取，得到待识别图像的识别结果；识别结果包括至少一个目标点的位置。本发明专利技术可以基于单目摄像头拍摄的图像进行识别，并且能够提高图像识别的准确率。

Image recognition method, device and system

The invention provides an image recognition method, device and system, which relates to the technical field of image recognition. The method comprises acquiring the image to be recognized, inputting the image to be recognized into the convolution neural network model, in which the convolution neural network model includes the residual pyramid module with translation invariance, the hourglass module and the cascade feature. Pyramid module of convolution neural network model; through the residual pyramid module, hourglass module and cascade feature pyramid module of convolution neural network model, feature extraction is carried out step by step to get the recognition result of the image to be recognized; the recognition result includes the location of at least one target point. The invention can recognize images captured by a monocular camera, and can improve the accuracy of image recognition.

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法、装置及系统
本专利技术涉及图像识别
，尤其是涉及一种图像识别方法、装置及系统。
技术介绍
由于手部姿态存在高形变、自遮挡、互遮挡、外部遮挡以及背景噪音等特点，基于普通摄像头进行手部姿态识别是非常困难的。现有技术通常依赖于多个普通摄像头，从而获取多角度的手部姿态的图像，再进行手部姿态识别。然而，上述手部姿态识别的方法，在应用时需要布置多个摄像头，并且需要进行摄像头的基准测试等，导致实际应用非常受限，而且模型的准确性也有待进一步提高。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种图像识别方法、装置及系统，可以通过单目摄像头进行图像识别，且提高了识别的准确率。第一方面，本专利技术实施例提供了一种图像识别方法，包括：获取待识别图像；将所述待识别图像输入至卷积神经网络模型；其中，所述卷积神经网络模型包括平移不变形的残差金字塔模块、沙漏模块和级联特征金字塔模块；通过所述卷积神经网络模型中的所述残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对所述待识别图像进行特征提取，得到所述待识别图像的识别结果；所述识别结果包括所述待识别图像上至少一个目标点的位置。进一步，所述方法还包括：通过所述待识别图像的导向概率热力图对所述卷积神经网络模型进行训练，直至所述卷积神经网络模型的误差收敛至预设值，将所述误差收敛至所述预设值时对应的参数作为所述卷积神经网络模型的参数。进一步，当下述条件均满足时，确定所述卷积神经网络模型的误差收敛至预设值：所述沙漏模块的损失函数值小于第一预设值；所述级联特征金字塔模块的损失函数值小于第二预设值。进一步，所述导向概率热力图的生成如...

【技术保护点】
1.一种图像识别方法，其特征在于，所述方法包括：获取待识别图像；将所述待识别图像输入至卷积神经网络模型；其中，所述卷积神经网络模型包括平移不变形的残差金字塔模块、沙漏模块和级联特征金字塔模块；通过所述卷积神经网络模型中的所述残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对所述待识别图像进行特征提取，得到所述待识别图像的识别结果；所述识别结果包括所述待识别图像上至少一个目标点的位置。

【技术特征摘要】
1.一种图像识别方法，其特征在于，所述方法包括：获取待识别图像；将所述待识别图像输入至卷积神经网络模型；其中，所述卷积神经网络模型包括平移不变形的残差金字塔模块、沙漏模块和级联特征金字塔模块；通过所述卷积神经网络模型中的所述残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对所述待识别图像进行特征提取，得到所述待识别图像的识别结果；所述识别结果包括所述待识别图像上至少一个目标点的位置。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：通过所述待识别图像的导向概率热力图对所述卷积神经网络模型进行训练，直至所述卷积神经网络模型的误差收敛至预设值，将所述误差收敛至所述预设值时对应的参数作为所述卷积神经网络模型的参数。3.根据权利要求2所述的方法，其特征在于，当下述条件均满足时，确定所述卷积神经网络模型的误差收敛至预设值：所述沙漏模块的损失函数值小于第一预设值；所述级联特征金字塔模块的损失函数值小于第二预设值。4.根据权利要求2所述的方法，其特征在于，所述导向概率热力图的生成如下：获取当前训练样本的真实热力图；根据所述真实热力图构建向导热力图；其中，所述向导热力图和所述真实热力图的中心与所述当前训练样本的目标点的位置相同；将所述向导热力图与真实热力图融合，得到导向概率热力图。5.根据权利要求1-4任一项所述的方法，其特征在于，所述获取待识别图像的步骤，包括：通过单目摄像头采集图像，并检测所述图像中的手部图像；将所述手部图像作为待识别图像。6.根据权利要求1-4任一项所述的方法，其特征在于，所述卷积神经网络模型还包括卷积层；所述通过所述卷积神经网络模型中的所述残差金字塔模块、沙漏模块和级联特征金字塔模块逐级对所述待识别图像进行特征提取，得到所述待识别图像的识别结果的步骤，包括：通过所述卷积层对输入的所述待识别图像进行卷积处理，得到所述待识别图像的第一特征图，并将所述第一特征图输入至所述残差金字塔模块；通过所述残差金字塔模块对所述第一特征图进行多尺度特征提取，得到所述待识别图像的第二特征图，并将所述第二特征图输入至所述沙漏模块；通过至少一个所述沙漏模块对所述第二特征图进行多尺度特征提取，得到所述待识别图像的第三特征图，并将所述第三特征图输入至所述级联特征金字塔模块；通过所述级联特征金字塔模块对所述第三特征图进行多尺度特征提取，输出识别结果。7.根据权利要求6所述的方法，其特征在于，所述残差金字塔模块包括主分支和金字塔分支；所述通过所述残差金字塔模块对所述第一特征图进行多尺度特征提...

【专利技术属性】
技术研发人员：陈文科，姚聪，
申请(专利权)人：北京旷视科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人