一种人体动作的识别方法及设备技术

技术编号:21892794 阅读:68 留言:0更新日期:2019-08-17 14:51
本发明专利技术适用于图像识别技术领域,提供了一种人体动作的识别方法及设备,包括:获取目标对象的视频文件;分别解析各个视频图像帧,提取视频图像帧中关于目标对象的人体区域图像,以及确定视频图像帧包含的可交互对象;在人体区域图像中标记出预设的人体关键部位列表内的各个关键部位,并获取各个关键部位的特征坐标;根据关键部位在各个视频图像帧中对应的特征坐标,生成关键特征序列;通过关键部位的关键特征序列,确定目标对象的候选动作;分别计算各个候选动作与可交互对象之间的匹配度,并根据匹配度确定目标对象的动作类型。本发明专利技术借助交互动作确定目标用户是否存在交互行为,从而能够对多个近似姿态进行区分,进一步提高了动作识别的准确率。

A Recognition Method and Equipment for Human Action

【技术实现步骤摘要】
一种人体动作的识别方法及设备
本专利技术属于图像识别
,尤其涉及一种人体动作的识别方法及设备。
技术介绍
随着图像识别技术的不断发展,计算机可以从图像文件以及视频文件中自动识别得到越来越多的信息,例如确定画面中包含的用户的人体动作类型,并基于识别得到动作信息进行对象追踪以及对象行为分析等操作,因此图像识别技术的准确度以及识别速率,则会直接影响后续步骤的处理效果。现有的人体动作的识别技术,一般是采用卷积神经网络进行识别,然而上述技术需要借助光流信息,需要多次进行时序递归操作,从而识别速度较低,而且准确率也不高,特别对于部分近似姿态行为,例如对于坐下以及蹲下两个动作,由于人体姿态相似,通过卷积神经网络无法准确进行区分,导致动作识别的准确率进一步降低。
技术实现思路
有鉴于此,本专利技术实施例提供了一种人体动作的识别方法及设备,以解决现有的人体动作的识别方法,识别速度较低,而且准确率也不高,特别对于部分近似姿态行为,例如对于坐下以及蹲下两个动作,由于人体姿态相似,通过卷积神经网络无法准确进行区分,导致动作识别的准确率进一步降低的问题。本专利技术实施例的第一方面提供了一种人体动作的识别方法,包括:获取目标对象的视频文件;所述视频文件包括多个视频图像帧;分别解析各个所述视频图像帧,提取所述视频图像帧中关于所述目标对象的人体区域图像,以及确定所述视频图像帧包含的可交互对象;在所述人体区域图像中标记出预设的人体关键部位列表内的各个关键部位,并获取各个所述关键部位的特征坐标;根据所述关键部位在各个所述视频图像帧中对应的所述特征坐标,生成关于所述关键部位的关键特征序列;通过各个所述关键部位的所述关键特征序列,确定所述目标对象的至少一个候选动作;分别计算各个所述候选动作与所述可交互对象之间的匹配度,并根据所述匹配度,从所述候选动作中确定所述目标对象的动作类型。本专利技术实施例的第二方面提供了一种人体动作的识别设备,包括:视频文件获取单元,用于获取目标对象的视频文件;所述视频文件包括多个视频图像帧;人体区域图像提取单元,用于分别解析各个所述视频图像帧,提取所述视频图像帧中关于所述目标对象的人体区域图像,以及确定所述视频图像帧包含的可交互对象;关键部位识别单元,用于在所述人体区域图像中标记出预设的人体关键部位列表内的各个关键部位,并获取各个所述关键部位的特征坐标;关键特征序列生成单元,用于根据所述关键部位在各个所述视频图像帧中对应的所述特征坐标,生成关于所述关键部位的关键特征序列;候选动作识别单元,用于通过各个所述关键部位的所述关键特征序列,确定所述目标对象的至少一个候选动作;动作类型识别单元,用于分别计算各个所述候选动作与所述可交互对象之间的匹配度,并根据所述匹配度,从所述候选动作中确定所述目标对象的动作类型。本专利技术实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面的各个步骤。本专利技术实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面的各个步骤。实施本专利技术实施例提供的一种人体动作的识别方法及设备具有以下有益效果:本专利技术实施例通过获取所需要进行动作行为分析的目标用户的视频文件,并对该视频文件的各个视频图像帧进行解析,确定每个视频图像帧中包含的人体区域图像,并识别出视频图像帧中可与目标用户之间可以存在交互行为的可交互对象,在人体区域图像中标记出各个关键部位,并根据各个关键部位的特征坐标,确定目标对象的各个部位的变化情况,从而确定目标对象的候选动作,根据候选动作与可交互对象之间的匹配度,进一步对多个姿态近似的候选动作进行筛选,确定目标对象的动作类型,自动识别目标对象的人体动作。与现有的人体动作的识别技术相比,本专利技术实施例无需依赖神经网络对视频图像进行动作类型的识别,并不借助光流信息,避免了需要进行时序递归而带来的识别时延,从而提高了识别的效率,另一方面终端设备会确定视频图像帧中的交互对象,借助交互动作确定目标用户是否存在交互行为,从而能够对多个近似姿态进行区分,进一步提高了动作识别的准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术第一实施例提供的一种人体动作的识别方法的实现流程图;图2是本专利技术第二实施例提供的一种人体动作的识别方法S106具体实现流程图;图3是本专利技术第三实施例提供的一种人体动作的识别方法S104具体实现流程图;图4是本专利技术第四实施例提供的一种人体动作的识别方法S102具体实现流程图;图5是本专利技术第五实施例提供的一种人体动作的识别方法S105具体实现流程图;图6是本专利技术一实施例提供的一种人体动作的识别设备的结构框图;图7是本专利技术另一实施例提供的一种终端设备的示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例通过获取所需要进行动作行为分析的目标用户的视频文件,并对该视频文件的各个视频图像帧进行解析,确定每个视频图像帧中包含的人体区域图像,并识别出视频图像帧中可与目标用户之间可以存在交互行为的可交互对象,在人体区域图像中标记出各个关键部位,并根据各个关键部位的特征坐标,确定目标对象的各个部位的变化情况,从而确定目标对象的候选动作,根据候选动作与可交互对象之间的匹配度,进一步对多个姿态近似的候选动作进行筛选,确定目标对象的动作类型,自动识别目标对象的人体动作,解决了现有的人体动作的识别方法,识别速度较低,而且准确率也不高,特别对于部分近似姿态行为,例如对于坐下以及蹲下两个动作,由于人体姿态相似,通过卷积神经网络无法准确进行区分,导致动作识别的准确率进一步降低的问题。在本专利技术实施例中,流程的执行主体为终端设备。该终端设备包括但不限于:服务器、计算机、智能手机以及平板电脑等能够执行人体动作的识别操作的设备。图1示出了本专利技术第一实施例提供的人体动作的识别方法的实现流程图,详述如下:在S101中,获取目标对象的视频文件;所述视频文件包括多个视频图像帧。在本实施例中,管理员可以指定包含目标对象的视频文件作为目标视频文件,在该情况下,终端设备会根据该目标视频文件的文件标识,从视频数据库中下载关于目标对象的视频文件,并对该目标对象的动作行为进行识别。优选地,该终端设备具体为一视频监控设备,会获取当前场景内视频文件;在该情况下,终端设备会将当前场景中拍摄得到的各个对象均识别为目标对象,基于不同拍摄对象的人脸图像,为各个对象配置对象编号,终端设备根据监控过程中生成的视频文件,实时判定各个监控对象的动作类型,若检测到某一目标对象的动作类型在异常动作列表内,则生成警告信息,以通知执行异常动作的监控对象停止该异常行为,实现实时对监控对象的异常动作的警告目的。可选地,用户可以将目标对象的人脸信息发送本文档来自技高网...

【技术保护点】
1.一种人体动作的识别方法,其特征在于,包括:获取目标对象的视频文件;所述视频文件包括多个视频图像帧;分别解析各个所述视频图像帧,提取所述视频图像帧中关于所述目标对象的人体区域图像,以及确定所述视频图像帧包含的可交互对象;在所述人体区域图像中标记出预设的人体关键部位列表内的各个关键部位,并获取各个所述关键部位的特征坐标;根据所述关键部位在各个所述视频图像帧中对应的所述特征坐标,生成关于所述关键部位的关键特征序列;通过各个所述关键部位的所述关键特征序列,确定所述目标对象的至少一个候选动作;分别计算各个所述候选动作与所述可交互对象之间的匹配度,并根据所述匹配度,从所述候选动作中确定所述目标对象的动作类型。

【技术特征摘要】
1.一种人体动作的识别方法,其特征在于,包括:获取目标对象的视频文件;所述视频文件包括多个视频图像帧;分别解析各个所述视频图像帧,提取所述视频图像帧中关于所述目标对象的人体区域图像,以及确定所述视频图像帧包含的可交互对象;在所述人体区域图像中标记出预设的人体关键部位列表内的各个关键部位,并获取各个所述关键部位的特征坐标;根据所述关键部位在各个所述视频图像帧中对应的所述特征坐标,生成关于所述关键部位的关键特征序列;通过各个所述关键部位的所述关键特征序列,确定所述目标对象的至少一个候选动作;分别计算各个所述候选动作与所述可交互对象之间的匹配度,并根据所述匹配度,从所述候选动作中确定所述目标对象的动作类型。2.根据权利要求1所述的识别方法,其特征在于,所述分别计算各个所述候选动作与所述可交互对象之间的匹配度,并根据所述匹配度,从所述候选动作中确定所述目标对象的动作类型,包括:获取所述可交互对象与所述人体区域图像之间的距离值,并基于所述距离值确定所述可交互对象的交互置信度;分别计算所述关键特征序列与各个所述候选动作的标准特征序列之间的相似度,将所述相似度识别为所述候选动作的动作置信度;基于所述可交互对象的对象类型,确定所述候选动作与所述对象类型的交互概率;从所述视频图像帧中提取所述可交互对象的对象区域图像,并根据所述对象区域图像与所述对象类型预设的标准图像,确定所述可交互对象的对象置信度;将所述交互置信度、所述动作置信度、所述对象置信度以及所述交互概率导入到匹配度计算模型,确定所述候选动作的所述匹配度;所述匹配度计算模型具体为:其中,为所述候选动作a的所述匹配度;为所述交互置信度;sh为所述动作置信度;so为所述对象置信度;为所述交互概率;为预设的所述候选动作a的触发概率;选取所述匹配度大于匹配阈值的所述候选动作,作为所述目标对象的动作类型。3.根据权利要求1所述的识别方法,其特征在于,所述根据所述关键部位在各个所述视频图像帧中对应的所述特征坐标,生成关于所述关键部位的关键特征序列,包括:获取帧数相邻的两个所述视频图像帧内同一所述关键部位的第一特征坐标以及第二特征坐标,并计算所述第一特征坐标与所述第二特征坐标之间的图像距离值;计算所述人体区域图像的图像面积,并基于所述图像面积确定所述目标对象与拍摄模块之间的拍摄焦距;将所述拍摄焦距、所述图像距离值以及所述视频文件的拍摄帧率导入到距离转换模型,计算两个所述视频图像帧中所述关键部分的实际移动距离;所述距离转换模型具体为:其中,Dist为所述实际移动距离;StandardDist为所述图像距离值;FigDist为所述拍摄焦距;BaseDist为预设的基准焦距;ActFrame为所述拍摄帧率;BaseFrame为所述基准帧率;将所述实际移动距离小于预设的距离阈值的两个所述特征坐标识别为互为关联的特征坐标;根据所有所述互为关联的特征坐标生成关于所述关键部位的所述关键特征序列。4.根据权利要求1-3任一项所述的识别方法,其特征在于,所述分别解析各个所述视频图像帧,提取所述视频图像帧中关于所述目标对象的人体区域图像,以及确定所述视频图像帧包含的可交互对象,包括:通过轮廓识别算法,获取所述视频图像帧的轮廓曲线,并计算各个所述轮廓曲线所包围的区域面积;根据各个所述区域面积,生成所述视频图像帧的人体识别窗口;基于所述人体识别窗口在所述视频图像帧上进行滑动框取,生成多个候选区域图像;分别计算各个所述候选区域图像与标准人体模板之间的重合率,并选取所述重合率大于预设重合率阈值的所述候选区域图像作为所述人体区域图像。5.根据权利要求1-3任一项所述的识别方法,其特征在于,所述通过各个所述关键部位的所述关键特征序列,确定所述目标对象的至少一个候选动作,包括:在预设的坐标轴内标记各个所述关键特征序列的特...

【专利技术属性】
技术研发人员:叶明
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1