一种目标动作检测方法及装置制造方法及图纸

技术编号:36401291 阅读:13 留言:0更新日期:2023-01-18 10:08
本申请提供了一种目标动作检测的方法及装置,利用人体检测算法从待检测图像中识别人体区域,得到人体区域检测框,利用人体骨骼点检测算法从人体区域检测框中识别人体骨骼点;根据人体骨骼点从所述待检测图像中截取目标手部区域图像;最后将目标手部区域图像输入预训练的动作分类模型,获取目标手部区域图像中的目标动作检测结果。由于只需要截取目标手部区域的图像,所以减少了任务场景图像中的背景干扰,提高了检测准确性;除此之外,由于只截取目标手部区域图像用于检测是否存在相关物体,这样就减小了模拟场景和真实场景的差异,可以利用模拟场景以及对模拟场景的细微调整作为训练样本训练出泛化性更高的模型,也提高了模型训练效率。型训练效率。型训练效率。

【技术实现步骤摘要】
一种目标动作检测方法及装置


[0001]本申请涉及动作识别
,尤其涉及一种目标动作检测方法及装置。

技术介绍

[0002]在现有业务场景中,经常包含对人体动作预测的需求,而其中很多动作又对物体有较强依赖,比如签字、手机拍照等行为。在实际的业务场景中,由于这些物体通常较小且与其他物体相似,并且客户通常对保密性有很高要求,很难获取大量真实场景的数据,导致直接目标检测的结果较差,比如银行场景中手机拍屏,需要结合手机的检测结果,而直接目标检测往往会把场景中的卡片,对讲机等误识别为手机,导致较多拍照误报。
[0003]现有技术中,通常是利用智能目标识别方式对目标图像进行直接目标检测,但是由于真实业务场景下的图像背景较为杂乱,导致检测结果准确性较低,除此之外,若想对目标动作进行检测,需要提前训练分类模型,由于真实业务场景下的图像背景较为杂乱,所以传统的分类模型需要大量数据进行训练,导致模型训练效率也较低。

技术实现思路

[0004]基于此,本申请提出了一种目标动作检测方法及装置,旨在提升检测结果的准确性。
[0005]为解决上述问题,本申请提供的技术方案如下:
[0006]一种目标动作检测方法,所述方法包括:
[0007]获取待检测图像;
[0008]利用人体检测算法从所述待检测图像中识别人体区域,得到人体区域检测框;
[0009]利用人体骨骼点检测算法从所述人体区域检测框中识别得到人体骨骼点;
[0010]根据所述人体骨骼点从所述待检测图像中截取目标手部区域图像;
[0011]将所述目标手部区域图像输入预训练的动作分类模型,获取所述目标手部区域图像中的目标动作检测结果。
[0012]在一种可能的实现方式中,所述利用人体骨骼点检测算法从所述人体区域检测框中识别得到人体骨骼点包括:
[0013]利用骨骼检测模型从所述人体区域检测框中识别得到人体骨骼点。
[0014]在一种可能的实现方式中,所述根据所述人体骨骼点从所述待检测图像中截取目标手部区域图像包括:
[0015]利用手肘和手腕处骨骼点做延长线得到待截取部位中心点,其中,所述延长线的延伸方向为从手肘向手腕延伸,延伸长度为预设系数与手肘到手腕的距离的乘积;
[0016]确定待截取部分的边长;
[0017]根据所述中心点位置以及待截取部分的边长截取目标手部区域图像。
[0018]在一种可能的实现方式中,所述确定待截取部分的边长包括:
[0019]设定固定值作为待截取部分的边长。
[0020]在一种可能的实现方式中,所述确定待截取部分的边长包括:
[0021]利用自适应算法得到待截取部分的边长。
[0022]在一种可能的实现方式中,所述利用自适应算法得到待截取部分的边长包括:
[0023]设置固定系数;
[0024]用所述固定系数与所述人体区域检测框的长度、宽度分别相乘,并取乘积的最小值作为待截取部分的边长。
[0025]在一种可能的实现方式中,所述预训练的动作分类模型的训练方法包括:
[0026]根据任务场景确定目标动作;
[0027]构建包括所述目标动作的图像作为正样本集合,以及不包括所述目标动作的图像作为负样本集合;
[0028]将所述正样本集合与所述负样本集合作为训练样本,进行动作分类模型的训练。
[0029]一种目标动作检测装置,所述装置包括:
[0030]待检测图像获取模块,用于获取待检测图像;
[0031]第一识别模块,利用人体检测算法从所述待检测图像中识别人体区域,得到人体区域检测框;
[0032]第二识别模块,用于利用人体骨骼点检测算法从所述人体区域检测框中识别得到人体骨骼点;
[0033]图像截取模块,用于根据所述人体骨骼点从所述待检测图像中截取目标手部区域图像;
[0034]检测结果获取模块,用于将所述目标手部区域图像输入预训练的动作分类模型,获取所述目标手部区域图像中的目标动作检测结果。
[0035]一种目标动作检测设备,所述设备包括:
[0036]存储器,用于存储所述目标动作检测的指令或代码;
[0037]处理器,用于执行所述目标动作检测的指令或代码,以实现上述的目标动作检测的方法。
[0038]一种计算机存储介质,所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现上述的目标动作检测的方法。
[0039]与现有技术相比,本申请具有如下有益效果:
[0040]本申请首先获取待检测图像;后利用人体检测算法从待检测图像中识别人体区域,得到人体区域检测框,并利用人体骨骼点检测算法从人体区域检测框中识别得到人体骨骼点;再根据人体骨骼点从所述待检测图像中截取目标手部区域图像;最后将目标手部区域图像输入预训练的动作分类模型,获取目标手部区域图像中的目标动作检测结果。由于只需要截取目标手部区域的图像,所以减少了任务场景图像中的背景干扰,提高了检测准确性;除此之外,由于只截取目标手部区域图像用于检测是否存在相关物体,这样就减小了模拟场景和真实场景的差异,可以利用模拟场景以及对模拟场景的细微调整作为训练样本训练出泛化性更高的模型,也提高了模型训练效率。
附图说明
[0041]为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术
描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0042]图1为本申请实施例提供的目标动作检测方法的一种方法流程图;
[0043]图2为本申请实施例提供的具体应用场景下的目标动作检测方法的一种方法流程图;
[0044]图3为本申请实施例提供的目标动作检测方法的应用场景示意图;
[0045]图4为本申请实施例提供的人体骨骼点检测示意图;
[0046]图5为本申请实施例提供的正负样本图像示意图;
[0047]图6为本申请实施例提供的一种目标动作检测装置的结构示意图。
具体实施方式
[0048]现有技术中,通常是利用智能目标识别方式对目标图像进行直接目标检测,例如基于人工智能的图像识别方法或基于人工智能的物体检测方法等,这种方式主要通过先获取待识别图像,然后利用上述检测方法进行目标物体或动作检测。
[0049]但是经研究,由于真实业务场景下的图像背景较为杂乱,导致检测结果准确性较低,除此之外,若想对目标动作进行检测,需要提前训练分类模型,而由于真实业务场景下的图像背景较为杂乱,所以传统的分类模型需要大量数据进行训练,导致模型训练效率也较低。
[0050]基于此,本申请实施例提出了一种基于人体拓扑先验的目标动作检测方法,首先获取待检测图像;后利用人体检测算法从待检测图像中识别人体区域,得到人体区域检测框,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标动作检测方法,其特征在于,所述方法包括:获取待检测图像;利用人体检测算法从所述待检测图像中识别人体区域,得到人体区域检测框;利用人体骨骼点检测算法从所述人体区域检测框中识别得到人体骨骼点;根据所述人体骨骼点从所述待检测图像中截取目标手部区域图像;将所述目标手部区域图像输入预训练的动作分类模型,获取所述目标手部区域图像中的目标动作检测结果。2.根据权利要求1所述的方法,其特征在于,所述利用人体骨骼点检测算法从所述人体区域检测框中识别得到人体骨骼点包括:利用骨骼检测模型从所述人体区域检测框中识别得到人体骨骼点。3.根据权利要求1所述的方法,其特征在于,所述根据所述人体骨骼点从所述待检测图像中截取目标手部区域图像包括:利用手肘和手腕处骨骼点做延长线得到待截取部位中心点,其中,所述延长线的延伸方向为从手肘向手腕延伸,延伸长度为预设系数与手肘到手腕的距离的乘积;确定待截取部分的边长;根据所述中心点位置以及待截取部分的边长截取目标手部区域图像。4.根据权利要求3所述的方法,其特征在于,所述确定待截取部分的边长包括:设定固定值作为待截取部分的边长。5.根据权利要求4所述的方法,其特征在于,所述确定待截取部分的边长包括:利用自适应算法得到待截取部分的边长。6.根据权利要求5所述的方法,其特征在于,所述利用自适应算法得到待截取部分的边长包括:设置固定系数;用所述固定系数与所述人体区域检测框的长度...

【专利技术属性】
技术研发人员:王青天
申请(专利权)人:北京爱笔科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1