【技术实现步骤摘要】
基于人体姿态及其躯干运动场的行为识别方法
[0001]本专利技术涉及计算机视觉领域,尤其涉及了一种基于人体姿态及其躯干运动场的行为识别方法,通过拼接关键点热图和躯干运动场构建人体姿态表征,对人体姿态本身、行为顺序及运动形式进行建模,适用于视频监控对用户肢体行为的分析和定位。
技术介绍
[0002]随着深度神经网络的迅猛发展,视觉驱动的人类行为识别取得了显著进展,并逐渐应用于视频监控、自动驾驶汽车和社交机器人的各个领域。行为识别的中心任务是将视频中的某个人类动作分类为预定义的动作类别,如“摘帽”、“摘掉眼镜”、“拍手”、“挥手”等。随着视频监控资源的指数级增长,原有通过人员在线监督和识别的解决方案存在成本高、效率低和工作时长制约的难题,已适应不了海量、多样和持续的监控视频分析工作。近年来,随着云边端计算与高清摄像头的联网互通,监控摄像头从第三视角完整捕捉和分析人们的连续动作成为可能。然而,人体行为存在行为时序长短不一和采样帧率不足等难题。针对低采样帧率的行为动作,现有解决方案仍然缺少对人体姿态本身、行为顺序及运动形式进行建模,无法实现稳定的行为识别技术。由此可见,在保持低帧率采样和高效计算的情况下,行为识别方法需要同时兼顾稳定性。
技术实现思路
[0003]本专利技术要克服现有技术的人体行为存在行为时序长短不一和采样帧率不足等缺点,提供一种基于人体姿态及其躯干运动场的行为识别方法。
[0004]为达到上述目的,本专利技术通过以下技术方案来实现的:一种基于人体姿态及其躯干运动场的行为识别方法,包括 ...
【技术保护点】
【技术特征摘要】
1.一种基于人体姿态及其躯干运动场的行为识别方法,其特征在于,包括:步骤S101,获取多人人体彩色图像作为输入;步骤S102,采用目标检测网络从所述多人人体彩色图像中检测二维人体包围框,采用二维人体姿态估计网络从截取的图像中计算二维人体姿态;步骤S103,基于二维人体姿态分别计算关键点热图和躯干运动场,拼接这两种模态作为人体姿态表征;步骤S104,将人体姿态表征作为输入,建立姿态网络用于提取人体行为特征,输出分类器中概率最大的行为类别;步骤S105,采集多人人体彩色图像序列、二维人体姿态以及对应的类别标签作为训练数据集,采用随机梯度下降的优化方法对姿态网络进行预训练优化。2.根据权利要求1所述的行为识别方法,其特征在于,所述步骤S101,包括:所述多人人体彩色图像应尽量捕捉到人体的全身姿态,通过调节彩色相机或监控摄像头的离地高度和拍摄角度获取优质图像。3.根据权利要求1所述的行为识别方法,其特征在于,所述步骤S102,包括:所述目标检测网络和二维人体姿态估计网络均采用轻量化可实时运行的开源预训练模型;所述目标检测网络从彩色图像中检测出“人”的类别置信度c
j
及其二维人体包围框(u1,v1,u2,v2),当人体类别置信度c
j
≥0.3时,从图像中剪裁出(u1,v1,u2,v2)作为局部图像;所述二维人体姿态估计网络从局部图像中计算出二维人体关键点,可由相机坐标系下人体的头部、脖子、右肩、左肩等14个关键关节的二维坐标组成,记作c
j
为置信度,ξ为每个人的关节总数,第t帧彩色图像的总人数为ρ,p∈{1,ρ}为图像第p个人。4.根据权利要求1所述的行为识别方法,其特征在于,所述步骤S103,包括:所述关键点热图将二维人体关键点重构成类似图像的模态,可选择高斯分布函数作为基函数,第t帧第j个关键点热图可以计算如下:式中,σ=1为高斯分布的标准差,第t帧彩色图像中有关第j个关节(x
j
,y
j
)的热图分布;通过将每一帧图像中的每一个关节热图拼接,可构建关键点热图为H
P
和W
P
分别表示热图的高度和宽度,T为采样帧数;所述躯干运动场将人体躯干的平面运动分解为平动和转动两种基本形式,通过组合平动和转动可以独立描述人体躯干的三种常见运动,即旋转,反转和平移;躯干运动场通过计算躯干运动掩膜和速度单位向量,描述相邻帧的人体躯干运动变化区域;给定任意一对相邻帧躯干和s和e分别为躯干的起始和终止端点的二维坐标,则第t帧第k个躯干的运动场可以计算如下:
式中,和
■
的像素值均为1,分别表示扇形和四边形的运动掩膜,例如,则表示以D0为圆心且旋转起始和终止端点分别为和的扇形,则表示以和为四个端点逆时针连接的四边形...
【专利技术属性】
技术研发人员:朱世强,郭方泰,宋伟,顾建军,朱佳凯,孟启炜,金天磊,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。