动作识别、姿势估计的方法及装置制造方法及图纸

技术编号：20944806 阅读：34 留言：0更新日期：2019-04-24 02:31

本申请提供了一种动作识别、姿势估计的方法及装置。该动作识别方法包括：确定待处理视频，所述待处理视频为包含人体图像的视频；根据所述待处理视频确定待处理图像；对所述待处理图像进行卷积处理，得到多个特征向量，其中，所述多个特征向量分别用于表示所述待处理图像不同位置的特征；根据所述多个特征向量确定所述人体的人体关节的权重系数集合；根据所述人体关节的权重系数集合对所述多个特征向量进行加权处理，得到所述人体关节的动作特征；根据所述人体关节的动作特征确定所述人体的动作特征；根据所述人体的动作特征，确定所述人体的动作类型。本申请能够提高动作识别的准确率。

Method and Device of Motion Recognition and Posture Estimation

This application provides a method and device for motion recognition and posture estimation. The action recognition method includes: determining the video to be processed, the video to be processed is a video containing human body image; determining the image to be processed according to the video to be processed; convoluting the image to be processed to obtain a plurality of feature vectors, in which the multiple feature vectors are used to represent the characteristics of different positions of the image to be processed; and according to the plurality of features. The eigenvector determines the set of weighting coefficients of the human joint; weights the multiple eigenvectors according to the set of weighting coefficients of the human joint, and obtains the action characteristics of the human joint; determines the action characteristics of the human body according to the action characteristics of the human joint; and determines the action types of the human body according to the action characteristics of the human body. This application can improve the accuracy of motion recognition.

全部详细技术资料下载

【技术实现步骤摘要】
动作识别、姿势估计的方法及装置
本申请涉及图像处理
，并且更具体地，涉及一种动作识别、姿势估计的方法及装置。
技术介绍
在很多场景下，需要对视频中的人体动作进行识别，以确定人体动作的动作类型。例如，在监控系统中，为了感知人的意图，需要对监控系统获取的视频中的人体动作进行识别，在人机交互系统中，为了对人的行为进行理解，需要对人机交互系统获取的视频中的人体动作进行识别。为了实现对视频中的人体动作的识别，现有方案是从待处理视频提取出某些帧的图片，然后采用卷积神经网络对图片进行特征提取，接下来再根据从图片中提取出来的特征向量确定人体的动作属于每个动作类型的置信度，然后将置信度最大(且置信度大于预设阈值)的动作类型确定为视频中的人体的动作类型。现有方案提取的是图片中的所有区域的特征，这些特征中包含了大量的与动作无关的特征，因此，最终进行动作识别的效果不好。另外，现有方案中还存在直接提取图片中的部分区域的特征来进行动作识别的方式，但是直接简单的提取图像部分区域的特征也可能无法较好地反映人体的动作特征，导致动作识别的准确率仍然较低。
技术实现思路
本申请提供一种动作识别方法、姿势估计方法及装置，能够提高动作识别的准确率。第一方面，提供了一种动作识别方法，所述方法包括：确定待处理视频，所述待处理视频为包含人体图像的视频；根据所述待处理视频确定待处理图像，所述待处理图像为下列图像中的至少一种：第一图像，根据所述待处理视频中的多帧图像生成的光流图像，其中，所述第一图像为所述待处理视频中的任意一帧图像，或者，所述第一图像为所述待处理视频中的多帧图像合成的图像；对所述待处理图像...

【技术保护点】
1.一种动作识别方法，其特征在于，包括：确定待处理视频，所述待处理视频为包含人体图像的视频；根据所述待处理视频确定待处理图像，所述待处理图像为下列图像中的至少一种：第一图像，根据所述待处理视频中的多帧图像生成的光流图像，其中，所述第一图像为所述待处理视频中的任意一帧图像，或者，所述第一图像为所述待处理视频中的多帧图像合成的图像；对所述待处理图像进行卷积处理，得到多个特征向量，其中，所述多个特征向量分别用于表示所述待处理图像不同位置的特征；根据所述多个特征向量确定所述人体的人体关节的权重系数集合，其中，所述人体关节的权重系数集合包括所述多个特征向量中的每个特征向量在所述人体关节的权重系数，第一类特征向量的权重系数大于或者等于第二类特征向量的权重系数，所述第一类特征向量对应在所述待处理图像中的位置和所述人体关节对应在所述待处理图像中的位置之间的距离为第一距离，所述第二类特征向量对应在所述待处理图像中的位置和所述人体关节对应在所述待处理图像中的位置之间的距离为第二距离，所述第一距离小于或者等于所述第二距离，所述人体关节的数量为多个，每个人体关节均对应一个权重系数集合；根据所述人体关节的权重系...

【技术特征摘要】
1.一种动作识别方法，其特征在于，包括：确定待处理视频，所述待处理视频为包含人体图像的视频；根据所述待处理视频确定待处理图像，所述待处理图像为下列图像中的至少一种：第一图像，根据所述待处理视频中的多帧图像生成的光流图像，其中，所述第一图像为所述待处理视频中的任意一帧图像，或者，所述第一图像为所述待处理视频中的多帧图像合成的图像；对所述待处理图像进行卷积处理，得到多个特征向量，其中，所述多个特征向量分别用于表示所述待处理图像不同位置的特征；根据所述多个特征向量确定所述人体的人体关节的权重系数集合，其中，所述人体关节的权重系数集合包括所述多个特征向量中的每个特征向量在所述人体关节的权重系数，第一类特征向量的权重系数大于或者等于第二类特征向量的权重系数，所述第一类特征向量对应在所述待处理图像中的位置和所述人体关节对应在所述待处理图像中的位置之间的距离为第一距离，所述第二类特征向量对应在所述待处理图像中的位置和所述人体关节对应在所述待处理图像中的位置之间的距离为第二距离，所述第一距离小于或者等于所述第二距离，所述人体关节的数量为多个，每个人体关节均对应一个权重系数集合；根据所述人体关节的权重系数集合对所述多个特征向量进行加权处理，得到所述人体关节的动作特征；根据所述人体关节的动作特征确定所述人体的动作特征；根据所述人体的动作特征，确定所述人体的动作类型。2.如权利要求1所述的方法，其特征在于，所述根据所述多个特征向量确定所述人体的人体关节的权重系数集合，包括：根据所述多个特征向量以及所述人体的累计动作信息，确定所述人体关节的权重系数集合，其中，所述人体的累计动作信息用于指示当前时刻之前累计的所述人体的动作特征。3.如权利要求1或2所述的方法，其特征在于，所述根据所述人体关节的动作特征确定所述人体的动作特征，包括：对所述人体关节的动作特征进行加权或者组合，得到所述人体的动作特征。4.如权利要求1或2所述的方法，其特征在于，所述根据所述人体关节的动作特征确定所述人体的动作特征，包括：对所述人体关节的动作特征进行加权或者组合，得到人体部分的动作特征，其中，所述人体包含多个所述人体部分，每个人体部分包含至少一个人体关节；对所述人体部分的动作特征进行加权或者组合，得到所述人体的动作特征。5.如权利要求1-4中任一项所述的方法，其特征在于，所述待处理图像包括所述第一图像和所述光流图像，所述对所述待处理图像进行卷积处理，得到多个特征向量，包括：对所述第一图像进行卷积处理，得到所述第一图像的多个特征向量；对所述光流图像进行卷积处理，得到所述光流图像的多个特征向量；所述根据所述多个特征向量确定所述人体的人体关节的权重系数集合，包括：根据所述第一图像的多个特征向量分别确定所述人体关节的第一类权重系数集合；根据所述光流图像的多个特征向量确定所述人体关节的第二类权重系数集合；所述根据所述人体关节的权重系数集合对所述多个特征向量进行加权处理，得到所述人体关节的动作特征，包括：根据所述第一类权重系数集合对所述第一图像的多个特征向量进行加权处理，得到所述人体关节的第一类动作特征；根据所述第二类权重系数集合对所述光流图像的多个特征向量进行加权处理，得到所述人体关节的第二类动作特征；所述根据所述人体关节的动作特征确定所述人体的动作特征，包括：对所述人体关节的第一类动作特征和所述人体关节的第二类动作特征进行加权或组合，得到所述人体的动作特征。6.一种姿势估计方法，其特征在于，包括：确定待处理视频，所述待处理视频为包含人体图像的视频；根据所述待处理视频确定待处理图像，所述待处理图像为下列图像中的至少一种：第一图像，根据所述待处理视频中的多帧图像生成的光流图像，其中，所述第一图像为所述待处理视频中的任意一帧图像，或者，所述第一图像为所述待处理视频中的多帧图像合成的图像；对所述待处理图像进行卷积处理，得到多个特征向量，其中，所述多个特征向量分别用于表示所述待处理图像不同位置的特征；根据所述多个特征向量确定所述人体的人体关节的权重系数集合，所述人体关节的权重系数集合包括所述多个特征向量中的每个特征向量在所述人体关节的权重系数，第一类特征向量的权重系数大于或者等于第二类特征向量的权重系数，所述第一类特征向量对应在所述待处理图像中的位置和所述人体关节对应在所述待处理图像中的位置之间的距离为第一距离，所述第二类特征向量对应在所述待处理图像中的位置和所述人体关节对应在所述待处理图像中的位置之间的距离为第二距离，所述第一距离小于或者等于所述第二距离，所述人体关节的数量为多个，每个人体关节均对应一个权重系数集合；将所述多个特征向量中的第一特征向量对应在所述待处理图像中的区域确定为所述人体关节的位置，其中，所述第一特征向量的权重系数为第一权重系数，所述第一权重系数为所述人体关节的权重系数集合中大于预设阈值的权重系数；根据所述人体关节的位置，确定所述人体的姿势。7.如权利要求6所述的方法，其特征在于，所述根据所述多个特征向量确定所述人体的人体关节的权重系数集合，包括：根据所述多个特征向量以及所述人体的累计动作信息，确定所述人体关节的权重系数集合，其中，所述人体的累计动作信息用于指示当前时刻之前累计的所述人体的动作特征。8.如权利要求6或7所述的方法，其特征在于，所述待处理图像包括所述第一图像和所述光流图像，所述对所述待处理图像进行卷积处理，得到多个特征向量，包括：对所述第一图像进行卷积处理，得到所述第一图像的多个特征向量；对所述光流图像进行卷积处理，得到所述光流图像的多个特征向量；所述根据所述多个特征向量确定所述人体的人体关节的权重系数集合，包括：根据所述第一图像的多个特征向量分别确定所述人体关节的第一类权重系数集合；根据所述光流图像的多个特征向量确定所述人体关节的第二类权重系数集合；根据所述第一类权重系数集合和所述第二类权重系数集合，确定所述人体关节的权重系数集合。9.如权利要求8所述的方法，其特征在于，所述根据所述第一类权重系数集合和所述第二类权重系数...

【专利技术属性】
技术研发人员：乔宇，杜文斌，王亚立，江立辉，刘健庄，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人