一种人体姿态估计方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35595953 阅读:12 留言:0更新日期:2022-11-16 15:15
本发明专利技术涉及一种人体姿态估计方法、装置、电子设备及存储介质,该方法包括:获取包含人体的待识别视频;根据待识别视频,通过预先训练的姿态识别模型识别出待识别视频中人体的关节点的位置;根据待识别视频中人体的关节点的位置,确定待识别视频中人体的目标姿态;其中,姿态识别模型是通过以下方式建立的:获取训练样本;根据训练样本,通过初始神经网络模型,得到每张样本图像对应的关节点的预测位置;根据各张样本图像的标注结果和预测位置,通过初始神经网络模型的Huber损失函数,确定初始神经网络模型的总损失函数值,根据总损失函数值,完成模型的训练。通过本发明专利技术的方法,采用Huber损失函数替代MAE损失函数,可减小梯度,利于模型的学习。利于模型的学习。利于模型的学习。

【技术实现步骤摘要】
一种人体姿态估计方法、装置、电子设备及存储介质


[0001]本专利技术涉及机器学习、人工智能
,具体而言,本专利技术涉及一种人体姿态估计方法、装置、电子设备及存储介质。

技术介绍

[0002]现有技术中,基于机器学习的方式进行人体姿态估计的方案涉及的损失函数通常选用MAE损失函数,但是由于MAE损失函数对于很小的损失值,梯度也很大,这样不利于模型的学习。

技术实现思路

[0003]本专利技术所要解决的技术问题是提供了一种人体姿态估计方法、装置、电子设备及存储介质,旨在解决上述至少一个技术问题。
[0004]第一方面,本专利技术解决上述技术问题的技术方案如下:一种人体姿态估计方法,该方法包括:
[0005]获取包含人体的待识别视频;
[0006]根据待识别视频,通过预先训练的姿态识别模型识别出待识别视频中人体的关节点的位置;
[0007]根据待识别视频中人体的关节点的位置,确定待识别视频中人体的目标姿态;
[0008]其中,姿态识别模型是通过以下方式建立的:
[0009]获取训练样本,训练样本包括包含多种人体姿态的样本图像,每张样本图像对应一个标注结果,对于每张样本图像,标注结果表征了该张样本图像对应的人体的关节点的位置;
[0010]根据训练样本,通过初始神经网络模型,得到每张样本图像对应的关节点的预测位置;
[0011]根据各张样本图像的标注结果和预测位置,通过初始神经网络模型的Huber损失函数,确定初始神经网络模型的总损失函数值;
[0012]若总损失函数值满足预设的训练结束条件,将训练结束时的初始神经网络模型确定为姿态识别模型,若总损失函数值不满足训练结束条件,调整初始神经网络模型的模型参数,重新基于训练样本对初始神经网络模型进行训练,直到总损失函数值满足训练结束条件。
[0013]本专利技术的有益效果是:在训练用于确定待识别视频中人体的关节点的位置的姿态识别模型时,采用Huber损失函数替代MAE损失函数,由于Huber损失是绝对误差,在误差很小时,就变为平方误差,这样可减小梯度,利于模型的学习。
[0014]在上述技术方案的基础上,本专利技术还可以做如下改进。
[0015]进一步,上述根据各张样本图像的标注结果和预测位置,通过初始神经网络模型的Huber损失函数,确定初始神经网络模型的总损失函数值,包括:
[0016]对于每张样本图像,根据样本图像的标注结果和预测位置,通过初始Huber损失函数,确定样本图像对应的第一损失函数值;
[0017]根据各第一损失函数值,确定初始神经网络模型的总损失函数值;
[0018]其中,上述Huber损失函数为:
[0019][0020]其中,b为一张样本图像的标注结果,f(a)为一张样本图像的预测位置,∈为超参数,L

(b,f(a))为一张样本图像对应的第一损失函数值。
[0021]采用上述进一步方案的有益效果是,Huber损失是绝对误差,在误差很小时,就变为平方误差,误差降到多小时变为二次误差由超参数∈来控制,当Huber损失在[0

∈,0+∈]之间时,等价为MSE,而在[

∞,∈]和[∈,+∞]时为MAE。通过Huber损失函数可更准确的表达出标注结果和预测位置之间的损失。
[0022]进一步,上述初始神经网络模型为Higher HRNet网络结构的模型,根据训练样本,通过初始神经网络模型,得到每张样本图像对应的关节点的预测位置,包括:
[0023]对于每张样本图像,将样本图像输入至初始神经网络模型,通过以下步骤得到每张样本图像对应的关节点的预测位置,其中,以下步骤包括:
[0024]提取样本图像的不同尺度的第一特征图;
[0025]通过双线性插值方法,将样本图像的不同尺度的第一特征图上采样至样本图像的图像大小,得到多个尺度相同的第二特征图;
[0026]将样本图像对应的多个第二特征图求平均,得到样本图像对应的第三特征图;
[0027]根据样本图像对应的第三特征图,确定样本图像对应的关节点的预测位置。
[0028]采用上述进一步方案的有益效果是,本申请方案中,初始神经网络模型为Higher HRNet网络结构的模型,通过初始神经网络模型在预测阶段可将所有尺度的输出特征通过双线性插值上采样到输入图片的大小,再进行平均,得到最终预测的关节点的预测位置,能够解决自下而上的多人姿势估计中的尺度变化挑战,并能更精确地定位关节点的位置。
[0029]进一步,多张样本图像包括不同场景和不同图像大小的图像。
[0030]采用上述进一步方案的有益效果是,采用不同场景、不同图像大小和不同人体姿态的图像作为样本图像进行模型的训练,可以满足更多不同的姿态识别需求。
[0031]进一步,上述获取训练样本,包括:
[0032]获取初始训练数据,初始训练数据包括包含多种人体姿态的样本图像,每张样本图像对应一个标注结果,对于每张样本图像,标注结果表征了该张样本图像对应的人体的关节点的位置;
[0033]对初始训练数据进行数据增广处理,得到训练样本,其中,数据增广处理包括图像合成、图像镜像和添加高斯噪点中的至少一项。
[0034]采用上述进一步方案的有益效果是,对初始训练数据进行数据增广处理,可使得训练样本中的样本图像更加丰富,提高模型的训练精度。
[0035]进一步,上述根据训练样本,通过初始神经网络模型,得到每张样本图像对应的关节点的预测位置,包括:
[0036]对每张样本图像进行特征提取,通过初始神经网络模型,得到多个特征图;
[0037]对各个特征图进行归一化处理,通过初始神经网络模型,得到多个归一化后的特征图;
[0038]根据各个归一化后的特征图,通过初始神经网络模型,确定每张样本图像对应的关节点的预测位置。
[0039]采用上述进一步方案的有益效果是,对各个特征图进行归一化处理,可加快网络收敛。
[0040]进一步,上述方法还包括:
[0041]根据目标姿态和预设的标准姿态进行比较,确定待识别视频中的目标姿态是否符合规范。
[0042]采用上述进一步方案的有益效果是,在识别出目标姿态后,可基于目标姿态和预设的标准姿态进行姿态评估,满足更多的应用需求。
[0043]第二方面,本专利技术为了解决上述技术问题还提供了一种人体姿态估计装置,该装置包括:
[0044]视频获取模块,用于获取包含人体的待识别视频;
[0045]关节点位置确定模块,用于根据待识别视频,通过预先训练的姿态识别模型识别出待识别视频中人体的关节点的位置;
[0046]目标姿态确定模块,用于根据待识别视频中人体的关节点的位置,确定待识别视频中人体的目标姿态;
[0047]其中,上述姿态识别模型是通过以下模型训练模块建立的,模型训练模块,用于获取训练样本,训练样本包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人体姿态估计方法,其特征在于,包括以下步骤:获取包含人体的待识别视频;根据所述待识别视频,通过预先训练的姿态识别模型识别出所述待识别视频中人体的关节点的位置;根据所述待识别视频中人体的关节点的位置,确定所述待识别视频中人体的目标姿态;其中,所述姿态识别模型是通过以下方式建立的:获取训练样本,所述训练样本包括包含多种人体姿态的样本图像,每张所述样本图像对应一个标注结果,对于每张所述样本图像,所述标注结果表征了该张样本图像对应的人体的关节点的位置;根据所述训练样本,通过初始神经网络模型,得到每张所述样本图像对应的关节点的预测位置;根据各张所述样本图像的标注结果和预测位置,通过所述初始神经网络模型的Huber损失函数,确定所述初始神经网络模型的总损失函数值;若所述总损失函数值满足预设的训练结束条件,将训练结束时的初始神经网络模型确定为所述姿态识别模型,若所述总损失函数值不满足所述训练结束条件,调整所述初始神经网络模型的模型参数,重新基于所述训练样本对所述初始神经网络模型进行训练,直到所述总损失函数值满足所述训练结束条件。2.根据权利要求1所述的方法,其特征在于,所述根据各张所述样本图像的标注结果和预测位置,通过所述初始神经网络模型的Huber损失函数,确定所述初始神经网络模型的总损失函数值,包括:对于每张所述样本图像,根据所述样本图像的标注结果和预测位置,通过所述初始Huber损失函数,确定所述样本图像对应的第一损失函数值;根据各所述第一损失函数值,确定所述初始神经网络模型的总损失函数值;其中,所述Huber损失函数为:其中,b为一张样本图像的标注结果,f(a)为一张样本图像的预测位置,∈为超参数,L

(b,f(a))为一张样本图像对应的第一损失函数值。3.根据权利要求1所述的方法,其特征在于,所述初始神经网络模型为Higher HRNet网络结构的模型,所述根据所述训练样本,通过初始神经网络模型,得到每张所述样本图像对应的关节点的预测位置,包括:对于每张所述样本图像,将所述样本图像输入至所述初始神经网络模型,通过以下步骤得到每张所述样本图像对应的关节点的预测位置,其中,所述以下步骤包括:提取所述样本图像的不同尺度的第一特征图;通过双线性插值方法,将所述样本图像的不同尺度的第一特征图上采样至所述样本图像的图像大小,得到多个尺度相同的第二特征图;
将所述样本图像对应的多个第二特征图求平均,得到所述样本图像对应的第三特征图;根据所述样本图像对应的第三特征图,确定所述样本图像对应的关节点的预测位置。4.根据权利要求1至3中任一项所述的方法,其特征在于,多张所述样本图像包括不同场景和不同图像大小的图像。5.根据权利要求1至3中任一项所述的方法...

【专利技术属性】
技术研发人员:陈友明
申请(专利权)人:四川弘和通讯集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1