一种人体姿态估计方法、装置、电子设备及存储介质制造方法及图纸

技术编号：35595953 阅读：12 留言：0更新日期：2022-11-16 15:15

本发明专利技术涉及一种人体姿态估计方法、装置、电子设备及存储介质，该方法包括：获取包含人体的待识别视频；根据待识别视频，通过预先训练的姿态识别模型识别出待识别视频中人体的关节点的位置；根据待识别视频中人体的关节点的位置，确定待识别视频中人体的目标姿态；其中，姿态识别模型是通过以下方式建立的：获取训练样本；根据训练样本，通过初始神经网络模型，得到每张样本图像对应的关节点的预测位置；根据各张样本图像的标注结果和预测位置，通过初始神经网络模型的Huber损失函数，确定初始神经网络模型的总损失函数值，根据总损失函数值，完成模型的训练。通过本发明专利技术的方法，采用Huber损失函数替代MAE损失函数，可减小梯度，利于模型的学习。利于模型的学习。利于模型的学习。

全部详细技术资料下载

【技术实现步骤摘要】
一种人体姿态估计方法、装置、电子设备及存储介质

[0001]本专利技术涉及机器学习、人工智能
，具体而言，本专利技术涉及一种人体姿态估计方法、装置、电子设备及存储介质。

技术介绍

[0002]现有技术中，基于机器学习的方式进行人体姿态估计的方案涉及的损失函数通常选用MAE损失函数，但是由于MAE损失函数对于很小的损失值，梯度也很大，这样不利于模型的学习。

技术实现思路

[0003]本专利技术所要解决的技术问题是提供了一种人体姿态估计方法、装置、电子设备及存储介质，旨在解决上述至少一个技术问题。
[0004]第一方面，本专利技术解决上述技术问题的技术方案如下：一种人体姿态估计方法，该方法包括：
[0005]获取包含人体的待识别视频；
[0006]根据待识别视频，通过预先训练的姿态识别模型识别出待识别视频中人体的关节点的位置；
[0007]根据待识别视频中人体的关节点的位置，确定待识别视频中人体的目标姿态；
[0008]其中，姿态识别模型是通过以下方式建立的：
[0009]获取训练样本，训练样本包括包含多种人体姿态的样本图像，每张样本图像对应一个标注结果，对于每张样本图像，标注结果表征了该张样本图像对应的人体的关节点的位置；
[0010]根据训练样本，通过初始神经网络模型，得到每张样本图像对应的关节点的预测位置；
[0011]根据各张样本图像的标注结果和预测位置，通过初始神经网络模型的Huber损失函数，确定初始神经网络模型的总损失函数...

【技术保护点】

【技术特征摘要】
1.一种人体姿态估计方法，其特征在于，包括以下步骤：获取包含人体的待识别视频；根据所述待识别视频，通过预先训练的姿态识别模型识别出所述待识别视频中人体的关节点的位置；根据所述待识别视频中人体的关节点的位置，确定所述待识别视频中人体的目标姿态；其中，所述姿态识别模型是通过以下方式建立的：获取训练样本，所述训练样本包括包含多种人体姿态的样本图像，每张所述样本图像对应一个标注结果，对于每张所述样本图像，所述标注结果表征了该张样本图像对应的人体的关节点的位置；根据所述训练样本，通过初始神经网络模型，得到每张所述样本图像对应的关节点的预测位置；根据各张所述样本图像的标注结果和预测位置，通过所述初始神经网络模型的Huber损失函数，确定所述初始神经网络模型的总损失函数值；若所述总损失函数值满足预设的训练结束条件，将训练结束时的初始神经网络模型确定为所述姿态识别模型，若所述总损失函数值不满足所述训练结束条件，调整所述初始神经网络模型的模型参数，重新基于所述训练样本对所述初始神经网络模型进行训练，直到所述总损失函数值满足所述训练结束条件。2.根据权利要求1所述的方法，其特征在于，所述根据各张所述样本图像的标注结果和预测位置，通过所述初始神经网络模型的Huber损失函数，确定所述初始神经网络模型的总损失函数值，包括：对于每张所述样本图像，根据所述样本图像的标注结果和预测位置，通过所述初始Huber损失函数，确定所述样本图像对应的第一损失函数值；根据各所述第一损失函数值，确定所述初始神经网络模型的总损失函数值；其中，所述Huber损失函数为：其中，b为一张样本图像的标注结果，f(a)为一张样本图像的预测位置，∈为超参数，L
∈
(b，f(a))为一张样本图像对应的第一损失函数值。3.根据权利要求1所述的方法，其特征在于，所述初始神经网络模型为Higher HRNet网络结构的模型，所述根据所述训练样本，通过初始神经网络模型，得到每张所述样本图像对应的关节点的预测位置，包括：对于每张所述样本图像，将所述样本图像输入至所述初始神经网络模型，通过以下步骤得到每张所述样本图像对应的关节点的预测位置，其中，所述以下步骤包括：提取所述样本图像的不同尺度的第一特征图；通过双线性插值方法，将所述样本图像的不同尺度的第一特征图上采样至所述样本图像的图像大小，得到多个尺度相同的第二特征图；
将所述样本图像对应的多个第二特征图求平均，得到所述样本图像对应的第三特征图；根据所述样本图像对应的第三特征图，确定所述样本图像对应的关节点的预测位置。4.根据权利要求1至3中任一项所述的方法，其特征在于，多张所述样本图像包括不同场景和不同图像大小的图像。5.根据权利要求1至3中任一项所述的方法...

【专利技术属性】
技术研发人员：陈友明，
申请(专利权)人：四川弘和通讯集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人