一种基于YOLO的2D姿态检测方法技术

技术编号:37197214 阅读:23 留言:0更新日期:2023-04-20 22:55
本发明专利技术涉及一种基于YOLO的2D姿态检测方法,包括1)训练集标注;标注出训练集图片中检测对象的Bbox、检测对象所有关键点坐标及关键点类别、各个关键点连接顺序;2)训练检测模型并进行检测;3)检测时的输入包含待检测图片与关键点连接顺序两部分组成;先经过检测模型检测出检测对象的Bbox、Bbox的embedding值,关键点的坐标、关键点的embedding值;然后关键点匹配组合部分根据embedding值将同个检测对象的关键点组合到一起,再依据关键点连接顺序确定检测对象位置及姿态。本发明专利技术保留了基于YOLO的姿态估计方法推理速度快显存占用小的特点,同时提高了关键点的预测精度并且几乎不增加额外的算法运行时间。外的算法运行时间。外的算法运行时间。

【技术实现步骤摘要】
一种基于YOLO的2D姿态检测方法


[0001]本专利技术涉及计算机视觉检测
,尤其是一种基于YOLO的2D姿态检测方法。

技术介绍

[0002]姿态估计是计算机视觉领域中的一个重要研究方向,目前被广泛应用于人体活动分析、人机交互以及视频监视等方面。姿态估计大多数是人体姿态估计,还有一些有手部姿态估计;人体姿态估计是指通过计算机算法在图像或视频中定位人体关键点(如肩、肘、腕、髋膝、膝、踝等);手部姿态估计分为有标记和无标记的姿态估计,用于理解手部行为的意思。
[0003]姿态估计的方法可分为基于传统的姿态估计和基于深度学习的姿态估计。
[0004]传统的姿态估计主要是基于图结构模型方法。基于图结构模型方法包含三部分:图模型、优化算法和组件外观模型,它提供了经典的对象统计模型,使用图形结构模型识别图像中的对象,缺点在于属于启发式的局部搜索,没办法找到全局最优解。
[0005]深度学习是自我解释型的学习方式,简单方便,功能强大,很多领域都在使用,而基于深度学习的姿态估计是利用深度卷积神经网络来增强人体估计系统的性能。与传统方法相比,深度学习能够得到更深层图像特征,对数据的表达更准确,因此已成为研究的主流方向。在深度学习方法中,根据检测人数分为单人姿态估计与多人姿态估计两类,对单人姿态估计分为基于坐标回归与基于热图检测的方法;对多人姿态估计可分为自上而下(Top

Down)和自下而上(Bottom

Up)的方法。
[0006]自上而下是指先检测目标,然后对提取出来的目标区域使用单目标关键点检测方法来构造姿态,这种方法优势是不用考虑多个目标的多个同类别关键点间的匹配组合问题,缺点是非常依赖目标检测效果,当目标检出不完整时就无法检出目标的所有关键点,同时随着目标数量的增加,计算量也会增加。自下而上的方法是目前的主流方法,这种方法先计算所有目标的所有关键点,再将关键点组合到对应的目标上,关键点匹配组合到目标的过程会增加算法的复杂度。
[0007]对于关键点检测目前常用的方法主要有基于heatmap的方法和YoloPose这样的用目标模型直接回归关键点坐标的方法。早期的回归坐标的方法是用于单目标的关键点检测,对单目标图片提取特征后直接用全连接层输出所有关键点坐标。Heatmap的方法将关键点坐标用图片的形式输出出来,生成与关键点类别数相等的热力图的数量,这种方法的缺点是计算量大,显存占用量高;通常heatmap的尺寸为输入图片的四分之一,这就导致至少会存在3个像素左右的误差。使用heatmap的方法随着关键点数量的增加会大幅度增加特征图尺寸,同时还需要考虑不同目标的同类别关键点的区分与匹配问题,如在人体姿态估计中一张图片存在两个人,每个人都有左肩、左肘、左手这三个关键点,即一张图片中的6个点应该怎样连接才能分别正确地构成这两个人的左手臂,在OpenPose算法中使用的是生成关键点亲和场的方法,这会进一步增加特征图尺寸,同时带来计算量与显存的增加;虽然heatmap方法也有通过生成关键点embedding的方法进行匹配,但无法解决生成heatmap特
征图带来的计算量增加的问题。
[0008]而YoloPose使用的是在预测目标对象的目标框同时,计算每个目标的每个关键点,即在得到关键点坐标的同时就已经与目标对象进行关联,通过目标对象的全局特征姿态来生成关键点,所以不用考虑找到关键点后与目标的关联匹配问题,因此可以使算法的检测速度达到与Yolo系列目标检测模型几乎相同的速度。但YoloPose存在的问题是对于大尺寸的目标,Yolo是通过低分辨率特征图进行回归的,所以对于大尺寸目标检测关键点这样的精细操作会带来较大的精度丢失。

技术实现思路

[0009]本专利技术要解决的技术问题是:提供一种基于YOLO的2D姿态估计方法,解决目前已有的基于YOLO架构在对超大目标的关键点定位时,由于都是基于目标所在anchor回归关键点的偏移量,导致anchor尺度过大、目标末端关键点距离anchor距离较远而产生了较大的误差的问题。
[0010]本专利技术解决其技术问题所采用的技术方案是:一种基于YOLO的2D姿态检测方法,包括以下步骤,
[0011]1)训练集标注;标注出训练集图片中检测对象的Bbox,即Bounding box、检测对象所有关键点坐标及关键点类别、各个关键点连接顺序;
[0012]2)训练检测模型并进行检测;
[0013]3)检测时的输入包含待检测图片与关键点连接顺序两部分组成;先经过检测模型检测出检测对象的Bbox、Bbox的embedding值,关键点的坐标、关键点的embedding值;然后关键点匹配组合部分根据embedding值将同个检测对象的关键点组合到一起,再依据关键点连接顺序确定检测对象位置及姿态。
[0014]进一步的说,本专利技术所述的步骤1)中,同一个检测对象的关键点数量、关键点类别完全相同且各个关键点的连接方式唯一,关键点的连接顺序标注时只创建一次。
[0015]再进一步的说,本专利技术所述的步骤3)中,关键点检测部分采用YoloX的backbone;输出的是点类型的目标,采用高分辨率的特征图提高定位精度,backbone中去掉了一个CSP1和CBA的结构,使原始backbone输出的特征图尺寸由(W/8,H/8)、(W/16,H/16)、(W/32,H/32)变为(W/4,H/4)、(W/8,H/8)、(W/16,H/16),其中W、H为输入图片的宽与高。
[0016]再进一步的说,本专利技术所述的步骤3)中,embedding head的loss计算方法如下:
[0017][0018]其中,P={(p
nk
)},n∈[1,N],k∈[1,K];p
nk
表示第n个目标的第k个关键点的坐标;e
nk
(p
nk
)是预测的第n个目标的第k个关键点的embedding值,e
n
是第n个目标的参考embedding,是当前目标所有关键点embedding的均值,计算方法如下:
[0019][0020]更进一步的说,本专利技术所述的步骤3)中,在对关键点匹配时,使用MeanShift算法对关键点的embedding进行聚类,包括以下步骤:
[0021]1、在未被标记的数据点中随机n个点作为n个聚类的起始中心点center;
[0022]2、找出以center为中心,半径为radius的区域中出现的所有数据点,认为这些点同属于一个聚类C;同时将在该聚类中数据点的访问频率加1;
[0023]3、以center为中心点,计算center点到集合M中每个数据点的向量之和,得到向量shift,对于给定的d维空间中的n个样本点xi,i=1,...,n,对于点x,MeanShift向量的基本形式为:
[0024][0025]4、center点沿着向量shift的方向移动,移动距离是|本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于YOLO的2D姿态检测方法,其特征在于:包括以下步骤,1)训练集标注;标注出训练集图片中检测对象的Bbox,即Bounding box、检测对象所有关键点坐标及关键点类别、各个关键点连接顺序;2)训练检测模型并进行检测;3)检测时的输入包含待检测图片与关键点连接顺序两部分组成;先经过检测模型检测出检测对象的Bbox、Bbox的embedding值,关键点的坐标、关键点的embedding值;然后关键点匹配组合部分根据embedding值将同个检测对象的关键点组合到一起,再依据关键点连接顺序确定检测对象位置及姿态。2.如权利要求1所述的一种基于YOLO的2D姿态检测方法,其特征在于:所述的步骤1)中,同一个检测对象的关键点数量、关键点类别完全相同且各个关键点的连接方式唯一,关键点的连接顺序标注时只创建一次。3.如权利要求2所述的一种基于YOLO的2D姿态检测方法,其特征在于:所述的步骤3)中,关键点检测部分采用YoloX的backbone;输出的是点类型的目标,采用高分辨率的特征图提高定位精度,backbone中去掉了一个CSP1和CBA的结构,使原始backbone输出的特征图尺寸由(W/8,H/8)、(W/16,H/16)、(W/32,H/32)变为(W/4,H/4)、(W/8,H/8)、(W/16,H/16),其中W、H为输入图片的宽与高。4.如权利要求3所述的一种基于YOLO的2D姿态检测方法,其特征在于:所述的步骤3)中,embedding head的loss计算方法如下:其中,P={(p
nk
)},n∈[1,N],k∈[1,K];p
...

【专利技术属性】
技术研发人员:都卫东和江镇祝伟
申请(专利权)人:征图新视江苏科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1