The invention provides a multi-person attitude detection method based on reinforcement learning optimization. Aiming at the fact that some bounding frames located by the target detector in traditional methods can not fit the human body well, which leads to the decrease of the detection accuracy of the attitude detector, and then affects the accuracy of the whole multi-person attitude detection algorithm, a fine target model based on reinforcement learning is proposed to adjust the inaccurate bounding frames. The fine target model makes the bounding frame fit human body better, reduces the redundant information of the image in the bounding frame, and improves the detection accuracy of the attitude detector.
【技术实现步骤摘要】
一种基于强化学习优化的多人姿态检测方法
本专利技术属于图像处理的
,具体涉及一种基于强化学习优化的多人姿态检测方法。
技术介绍
强化学习是受到博弈论以及行为心理学启发的机器学习分支,是一种面向目标的算法,该算法在训练中将学习针对一个问题如何采取一些动作以使得目标最优化,如学习在游戏中的如何操作以获得最高的分数。强化学习可以从一个随机选择的状态开始,在不断的训练中可以达到超过人类水平的能力。强化学习的训练中做出错误的预测时会受到惩罚,反之则会受到奖励,强化学习便是在不断地受到奖励与惩罚后学习如何选择动作以使得奖励最大化的过程。目前针对图像中人像姿态的判断,尤其是针对多人姿态的检测主要采用两步检测算法:以目标检测器定位目标,以姿态检测器对所有目标检测姿态。利用目标检测器检测图像中的人像,然后利用姿态检测器来检测判断人像的姿态,但是才用这种方式对人像进行判断,由于目标检测器所定位的有些包围框有时候不能很好地贴合人体,也就是其仅仅定位人体,人体有部分在包围框内,有一部分则在包围框外部,这样就使得人体姿势判断时的姿态检测器的检测精度下降,而且图像中存在多个人时更加不准 ...
【技术保护点】
1.一种基于强化学习优化的多人姿态检测方法,其特征在于,包括以下步骤:S1.采集多张多人图片并进行处理,生成多人数据集及单人数据集,将所述单人与多人数据集按预设比例分别拆分为训练集与测试集,得到多人训练集、多人测试集、单人训练集、单人测试集;S2.建立用于定位目标的目标检测器、用于调整包围框的目标精细模型、用于检测人体姿态的姿态检测器,三者形成多人姿态检测算法结构;S3.利用单人训练集训练目标精细模型中的特征提取部分,作为目标精细模型的预训练参数,并使用单人测试集进行测试以防止模型过拟合;S4.利用多人训练集训练目标检测器,利用单人训练集集训练姿态检测器,并使用各自的测试集 ...
【技术特征摘要】
1.一种基于强化学习优化的多人姿态检测方法,其特征在于,包括以下步骤:S1.采集多张多人图片并进行处理,生成多人数据集及单人数据集,将所述单人与多人数据集按预设比例分别拆分为训练集与测试集,得到多人训练集、多人测试集、单人训练集、单人测试集;S2.建立用于定位目标的目标检测器、用于调整包围框的目标精细模型、用于检测人体姿态的姿态检测器,三者形成多人姿态检测算法结构;S3.利用单人训练集训练目标精细模型中的特征提取部分,作为目标精细模型的预训练参数,并使用单人测试集进行测试以防止模型过拟合;S4.利用多人训练集训练目标检测器,利用单人训练集集训练姿态检测器,并使用各自的测试集分别进行测试以防止模型过拟合;使用目标检测器和姿态检测器的训练精度生成正方形单人图片数据集训练目标精细模型,在训练中使用S3中所述预训练参数对目标精细模型进行初始化;S5.输入需要检测的多人图片,利用目标检测器定位所述需要检测的多人图片中的多个人体目标,利用目标精细模型对多个人体目标的包围框进行调整,及利用姿态检测器分别检测多个人体目标的姿态。2.根据权利要求1所述的一种基于强化学习优化的多人姿态检测方法,其特征在于,所述步骤S1中的多人数据集包括多人图片与人体包围框坐标标签。3.根据权利要求1所述的一种基于强化学习优化的多人姿态检测方法,其特征在于,所述步骤S1中的单人数据集包括利用包围框裁剪后的单人图片以及每个人体的初始关节点坐标。4.根据权利要求1或2或3所述的一种基于强化学习优化的多人姿态检测方法,其特征在于,所述步骤S1具体包括以下过程:S11.采集多人图片,使用包围框对多人图片中的多个人体目标进行定位,并保存多个人体目标的包围框坐标,包围框坐标由左上角点与右下角点组成,形成多人数据集;S12.对多人图片中的每个人体目标的每个初始关节点坐标进行定位,与每个人体目标的包围框一一对应保存所述每个初始关节点坐标,所述初始关节点坐标由单个坐标点构成;S13.根据多人数据集中的包围框对人体目标进行裁切得到单人图片,将裁切后的单人图片通过周围补零的方式补成边长为单人图片长边的长度的正方形单人图片;将所述多人图片中的关节点坐标映射至所述正方形单人图片中,保存关节点坐标数据,形成单人数据集;S14.对多人数据集和单人数据集进行总数量10%的随机抽取,作为多人测试集和单人测试集,其余的图片作为多人训练集和单人训练集。5.根据权利要求4所述的一种基于强化学习优化的多人姿态检测方法,其特征在于,所述周围补零是指图片为非正方形时,在图片周围补充RGB亮度为零的像素点,使其成为正方形图片。6.根据权利要求1或2或3所述的一种基于强化学习优化的多人姿态检测方法,其特征在于,所述步骤S4具体包括以下过程:S41.利用多人训练集训练目标检测器,并在训练之后用多人测试集对目标检测器进行测试以防止其过拟合;对多人训练集与测...
【专利技术属性】
技术研发人员:黄铎,应娜,郭春生,朱宸都,蔡哲栋,刘兆森,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。