一种人体动作的识别方法及设备技术

技术编号：21892794 阅读：68 留言：0更新日期：2019-08-17 14:51

本发明专利技术适用于图像识别技术领域，提供了一种人体动作的识别方法及设备，包括：获取目标对象的视频文件；分别解析各个视频图像帧，提取视频图像帧中关于目标对象的人体区域图像，以及确定视频图像帧包含的可交互对象；在人体区域图像中标记出预设的人体关键部位列表内的各个关键部位，并获取各个关键部位的特征坐标；根据关键部位在各个视频图像帧中对应的特征坐标，生成关键特征序列；通过关键部位的关键特征序列，确定目标对象的候选动作；分别计算各个候选动作与可交互对象之间的匹配度，并根据匹配度确定目标对象的动作类型。本发明专利技术借助交互动作确定目标用户是否存在交互行为，从而能够对多个近似姿态进行区分，进一步提高了动作识别的准确率。

A Recognition Method and Equipment for Human Action

全部详细技术资料下载

【技术实现步骤摘要】
一种人体动作的识别方法及设备
本专利技术属于图像识别
，尤其涉及一种人体动作的识别方法及设备。
技术介绍
随着图像识别技术的不断发展，计算机可以从图像文件以及视频文件中自动识别得到越来越多的信息，例如确定画面中包含的用户的人体动作类型，并基于识别得到动作信息进行对象追踪以及对象行为分析等操作，因此图像识别技术的准确度以及识别速率，则会直接影响后续步骤的处理效果。现有的人体动作的识别技术，一般是采用卷积神经网络进行识别，然而上述技术需要借助光流信息，需要多次进行时序递归操作，从而识别速度较低，而且准确率也不高，特别对于部分近似姿态行为，例如对于坐下以及蹲下两个动作，由于人体姿态相似，通过卷积神经网络无法准确进行区分，导致动作识别的准确率进一步降低。
技术实现思路
有鉴于此，本专利技术实施例提供了一种人体动作的识别方法及设备，以解决现有的人体动作的识别方法，识别速度较低，而且准确率也不高，特别对于部分近似姿态行为，例如对于坐下以及蹲下两个动作，由于人体姿态相似，通过卷积神经网络无法准确进行区分，导致动作识别的准确率进一步降低的问题。本专利技术实施例的第一方面提供了一种人体动作的识别方法，包括：获取目标对象的视频文件；所述视频文件包括多个视频图像帧；分别解析各个所述视频图像帧，提取所述视频图像帧中关于所述目标对象的人体区域图像，以及确定所述视频图像帧包含的可交互对象；在所述人体区域图像中标记出预设的人体关键部位列表内的各个关键部位，并获取各个所述关键部位的特征坐标；根据所述关键部位在各个所述视频图像帧中对应的所述特征坐标，生成关于所述关键部位的关键特征序列；通...

【技术保护点】
1.一种人体动作的识别方法，其特征在于，包括：获取目标对象的视频文件；所述视频文件包括多个视频图像帧；分别解析各个所述视频图像帧，提取所述视频图像帧中关于所述目标对象的人体区域图像，以及确定所述视频图像帧包含的可交互对象；在所述人体区域图像中标记出预设的人体关键部位列表内的各个关键部位，并获取各个所述关键部位的特征坐标；根据所述关键部位在各个所述视频图像帧中对应的所述特征坐标，生成关于所述关键部位的关键特征序列；通过各个所述关键部位的所述关键特征序列，确定所述目标对象的至少一个候选动作；分别计算各个所述候选动作与所述可交互对象之间的匹配度，并根据所述匹配度，从所述候选动作中确定所述目标对象的动作类型。

【技术特征摘要】
1.一种人体动作的识别方法，其特征在于，包括：获取目标对象的视频文件；所述视频文件包括多个视频图像帧；分别解析各个所述视频图像帧，提取所述视频图像帧中关于所述目标对象的人体区域图像，以及确定所述视频图像帧包含的可交互对象；在所述人体区域图像中标记出预设的人体关键部位列表内的各个关键部位，并获取各个所述关键部位的特征坐标；根据所述关键部位在各个所述视频图像帧中对应的所述特征坐标，生成关于所述关键部位的关键特征序列；通过各个所述关键部位的所述关键特征序列，确定所述目标对象的至少一个候选动作；分别计算各个所述候选动作与所述可交互对象之间的匹配度，并根据所述匹配度，从所述候选动作中确定所述目标对象的动作类型。2.根据权利要求1所述的识别方法，其特征在于，所述分别计算各个所述候选动作与所述可交互对象之间的匹配度，并根据所述匹配度，从所述候选动作中确定所述目标对象的动作类型，包括：获取所述可交互对象与所述人体区域图像之间的距离值，并基于所述距离值确定所述可交互对象的交互置信度；分别计算所述关键特征序列与各个所述候选动作的标准特征序列之间的相似度，将所述相似度识别为所述候选动作的动作置信度；基于所述可交互对象的对象类型，确定所述候选动作与所述对象类型的交互概率；从所述视频图像帧中提取所述可交互对象的对象区域图像，并根据所述对象区域图像与所述对象类型预设的标准图像，确定所述可交互对象的对象置信度；将所述交互置信度、所述动作置信度、所述对象置信度以及所述交互概率导入到匹配度计算模型，确定所述候选动作的所述匹配度；所述匹配度计算模型具体为：其中，为所述候选动作a的所述匹配度；为所述交互置信度；sh为所述动作置信度；so为所述对象置信度；为所述交互概率；为预设的所述候选动作a的触发概率；选取所述匹配度大于匹配阈值的所述候选动作，作为所述目标对象的动作类型。3.根据权利要求1所述的识别方法，其特征在于，所述根据所述关键部位在各个所述视频图像帧中对应的所述特征坐标，生成关于所述关键部位的关键特征序列，包括：获取帧数相邻的两个所述视频图像帧内同一所述关键部位的第一特征坐标以及第二特征坐标，并计算所述第一特征坐标与所述第二特征坐标之间的图像距离值；计算所述人体区域图像的图像面积，并基于所述图像面积确定所述目标对象与拍摄模块之间的拍摄焦距；将所述拍摄焦距、所述图像距离值以及所述视频文件的拍摄帧率导入到距离转换模型，计算两个所述视频图像帧中所述关键部分的实际移动距离；所述距离转换模型具体为：其中，Dist为所述实际移动距离；StandardDist为所述图像距离值；FigDist为所述拍摄焦距；BaseDist为预设的基准焦距；ActFrame为所述拍摄帧率；BaseFrame为所述基准帧率；将所述实际移动距离小于预设的距离阈值的两个所述特征坐标识别为互为关联的特征坐标；根据所有所述互为关联的特征坐标生成关于所述关键部位的所述关键特征序列。4.根据权利要求1-3任一项所述的识别方法，其特征在于，所述分别解析各个所述视频图像帧，提取所述视频图像帧中关于所述目标对象的人体区域图像，以及确定所述视频图像帧包含的可交互对象，包括：通过轮廓识别算法，获取所述视频图像帧的轮廓曲线，并计算各个所述轮廓曲线所包围的区域面积；根据各个所述区域面积，生成所述视频图像帧的人体识别窗口；基于所述人体识别窗口在所述视频图像帧上进行滑动框取，生成多个候选区域图像；分别计算各个所述候选区域图像与标准人体模板之间的重合率，并选取所述重合率大于预设重合率阈值的所述候选区域图像作为所述人体区域图像。5.根据权利要求1-3任一项所述的识别方法，其特征在于，所述通过各个所述关键部位的所述关键特征序列，确定所述目标对象的至少一个候选动作，包括：在预设的坐标轴内标记各个所述关键特征序列的特...

【专利技术属性】
技术研发人员：叶明，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人