一种基于YOLO的2D姿态检测方法技术

技术编号：37197214 阅读：23 留言：0更新日期：2023-04-20 22:55

本发明专利技术涉及一种基于YOLO的2D姿态检测方法，包括1)训练集标注；标注出训练集图片中检测对象的Bbox、检测对象所有关键点坐标及关键点类别、各个关键点连接顺序；2)训练检测模型并进行检测；3)检测时的输入包含待检测图片与关键点连接顺序两部分组成；先经过检测模型检测出检测对象的Bbox、Bbox的embedding值，关键点的坐标、关键点的embedding值；然后关键点匹配组合部分根据embedding值将同个检测对象的关键点组合到一起，再依据关键点连接顺序确定检测对象位置及姿态。本发明专利技术保留了基于YOLO的姿态估计方法推理速度快显存占用小的特点，同时提高了关键点的预测精度并且几乎不增加额外的算法运行时间。外的算法运行时间。外的算法运行时间。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于YOLO的2D姿态检测方法

[0001]本专利技术涉及计算机视觉检测
，尤其是一种基于YOLO的2D姿态检测方法。

技术介绍

[0002]姿态估计是计算机视觉领域中的一个重要研究方向，目前被广泛应用于人体活动分析、人机交互以及视频监视等方面。姿态估计大多数是人体姿态估计，还有一些有手部姿态估计；人体姿态估计是指通过计算机算法在图像或视频中定位人体关键点(如肩、肘、腕、髋膝、膝、踝等)；手部姿态估计分为有标记和无标记的姿态估计，用于理解手部行为的意思。
[0003]姿态估计的方法可分为基于传统的姿态估计和基于深度学习的姿态估计。
[0004]传统的姿态估计主要是基于图结构模型方法。基于图结构模型方法包含三部分：图模型、优化算法和组件外观模型，它提供了经典的对象统计模型，使用图形结构模型识别图像中的对象，缺点在于属于启发式的局部搜索，没办法找到全局最优解。
[0005]深度学习是自我解释型的学习方式，简单方便，功能强大，很多领域都在使用，而基于深度学习的姿态估计是利用深度卷积神经网络来增强人体估计系统的性能。与传统方法相比，深度学习能够得到更深层图像特征，对数据的表达更准确，因此已成为研究的主流方向。在深度学习方法中，根据检测人数分为单人姿态估计与多人姿态估计两类，对单人姿态估计分为基于坐标回归与基于热图检测的方法；对多人姿态估计可分为自上而下(Top
‑
Down)和自下而上(Bottom
‑
Up)的方法。
[0006]自上而下是指先检测目...

【技术保护点】

【技术特征摘要】
1.一种基于YOLO的2D姿态检测方法，其特征在于：包括以下步骤，1)训练集标注；标注出训练集图片中检测对象的Bbox，即Bounding box、检测对象所有关键点坐标及关键点类别、各个关键点连接顺序；2)训练检测模型并进行检测；3)检测时的输入包含待检测图片与关键点连接顺序两部分组成；先经过检测模型检测出检测对象的Bbox、Bbox的embedding值，关键点的坐标、关键点的embedding值；然后关键点匹配组合部分根据embedding值将同个检测对象的关键点组合到一起，再依据关键点连接顺序确定检测对象位置及姿态。2.如权利要求1所述的一种基于YOLO的2D姿态检测方法，其特征在于：所述的步骤1)中，同一个检测对象的关键点数量、关键点类别完全相同且各个关键点的连接方式唯一，关键点的连接顺序标注时只创建一次。3.如权利要求2所述的一种基于YOLO的2D姿态检测方法，其特征在于：所述的步骤3)中，关键点检测部分采用YoloX的backbone；输出的是点类型的目标，采用高分辨率的特征图提高定位精度，backbone中去掉了一个CSP1和CBA的结构，使原始backbone输出的特征图尺寸由(W/8,H/8)、(W/16,H/16)、(W/32,H/32)变为(W/4,H/4)、(W/8,H/8)、(W/16,H/16)，其中W、H为输入图片的宽与高。4.如权利要求3所述的一种基于YOLO的2D姿态检测方法，其特征在于：所述的步骤3)中，embedding head的loss计算方法如下：其中，P＝{(p
nk
)}，n∈[1,N]，k∈[1,K]；p
...

【专利技术属性】
技术研发人员：都卫东，和江镇，祝伟，
申请(专利权)人：征图新视江苏科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人