基于深度学习的人体动作检测方法、设备及存储介质技术

技术编号：38706119 阅读：9 留言：0更新日期：2023-09-08 14:46

本申请提供一种基于深度学习的人体动作检测方法、设备及存储介质，所述方法包括：获取目标视频对应的图像序列中获取一原始图像；从原始图像中截取目标图像，并获取对应的预设位置信息；基于目标图像建立目标坐标系；将目标图像输入预设的人体关键点检测模型，得到第一人体关键点坐标；根据第一人体关键点坐标以及预设位置信息，得到第二人体关键点坐标；基于第二人体关键点坐标，确定人体的目标边界框；基于目标边界框，获取图像序列中原始图像的所有在后图像中的第三人体关键点坐标；将获取的第二人体关键点坐标以及第三人体关键点坐标输入反向动力学模型，得到驱动参数化人体模型的旋转数据，得到人体的动作。本申请能够有效地检测人体动作。地检测人体动作。地检测人体动作。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的人体动作检测方法、设备及存储介质

[0001]本申请涉及人体检测
，尤其涉及一种基于深度学习的人体动作检测方法、设备及存储介质。

技术介绍

[0002]人体动作捕捉技术，简称人体动捕技术(Motion Capture,Mocap)，用于捕捉视频中人体运动的姿态或者运动数据，将这些运动姿态数据作为一种驱动数据去驱动虚拟形象模型(如，参数化人体模型)或者进行行为分析。在相关技术中，为了使采集到的动作数据能很好的驱动虚拟形象模型，通常采用反向动力学(Inverse Kinematics，IK)算法计算得到每个关节点的旋转信息，但是直接采用IK算法得到的旋转角缺少一个自由度，无法有效地对人体动作进行检测。

技术实现思路

[0003]本申请实施例公开了一种基于深度学习的人体动作检测方法、设备及介质，解决了无法有效地对人体动作进行检测的技术问题。
[0004]本申请提供一种基于深度学习的人体动作检测方法，所述方法包括：获取目标视频对应的图像序列，从所述图像序列中获取一原始图像；从所述原始图像中截取目标图像，并获取所述目标图像在所述原始图像中对应的预设位置信息；基于所述目标图像建立目标坐标系；将所述目标图像输入预设的人体关键点检测模型，检测所述目标图像中人体在所述目标坐标系中对应的第一人体关键点坐标；根据所述第一人体关键点坐标以及所述预设位置信息，得到第二人体关键点坐标；基于所述第二人体关键点坐标，确定所述人体的目标边界框；基于所述目标边界框，获取所述图像序列中所述原始图像之后的所有图像...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的人体动作检测方法，其特征在于，包括：获取目标视频对应的图像序列，从所述图像序列中获取一原始图像；从所述原始图像中截取目标图像，并获取所述目标图像在所述原始图像中对应的预设位置信息；基于所述目标图像建立目标坐标系；将所述目标图像输入预设的人体关键点检测模型，检测所述目标图像中人体在所述目标坐标系中对应的第一人体关键点坐标；根据所述第一人体关键点坐标以及所述预设位置信息，得到第二人体关键点坐标；基于所述第二人体关键点坐标，确定所述人体的目标边界框；基于所述目标边界框，获取所述图像序列中所述原始图像之后的所有图像中的第三人体关键点坐标；将获取的第二人体关键点坐标以及第三人体关键点坐标输入反向动力学模型，得到对应的旋转数据；基于所述旋转数据，驱动参数化人体模型，得到所述人体的动作。2.根据权利要求1所述的方法，其特征在于，所述基于所述目标边界框，获取所述图像序列中所述原始图像之后的所有图像中的第三人体关键点坐标，包括：获取第N张原始图像对应的目标边界框；基于所述第N张原始图像对应的目标边界框，截取第N+1张原始图像对应的目标图像，其中，所述图像序列中共有M张原始图像，N∈M；基于所述第N+1张原始图像对应的目标图像，得到所述第N+1张原始图像对应的第三人体关键点坐标。3.根据权利要求1所述的方法，其特征在于，将所述目标图像输入预设的人体关键点检测模型之前，所述方法还包括：计算所述目标图像的跟踪置信度；在所述目标图像的跟踪置信度满足预设跟踪置信度时，将所述目标图像输入人体关键点检测模型；在所述目标图像的跟踪置信度不满足预设跟踪置信度时，舍弃所述目标图像，返回执行从所述原始图像中截取目标图像，以获取一更新的目标图像。4.根据权利要求3所述的方法，其特征在于，所述计算所述目标图像的跟踪置信度，包括：将所述目标图像输入预设的人体跟踪模型，得到对所述目标图像的置信...

【专利技术属性】
技术研发人员：吉祥，
申请(专利权)人：抖动科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人