姿态估计模型的训练与姿态估计方法、装置、设备及介质制造方法及图纸

技术编号：33407358 阅读：24 留言：0更新日期：2022-05-11 23:31

本发明专利技术公开了一种姿态估计模型的训练与姿态估计方法、装置、设备及介质方法、装置、设备及存储介质，该方法包括：获取图像样本集；通过图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型；其中，初始姿态估计模型包括：特征提取网络和堆叠沙漏网络；特征提取网络包括：特征提取模块和空间金字塔池化模块；空间金字塔池化模块包括：并联的第一特征提取单元和第二特征提取单元，以及特征融合单元；第一特征提取单元和第二特征提取单元设置不同的特征提取尺度，能够为姿态估计提供提取同一层更高精度的多尺度特征，从而提高基于堆叠沙漏网络的姿态估计模型的姿态估计精度。沙漏网络的姿态估计模型的姿态估计精度。沙漏网络的姿态估计模型的姿态估计精度。

全部详细技术资料下载

【技术实现步骤摘要】
姿态估计模型的训练与姿态估计方法、装置、设备及介质

[0001]本专利技术涉及计算机技术
，尤其涉及一种姿态估计模型的训练与姿态估计方法、装置、设备及介质。

技术介绍

[0002]人体姿态估计是计算机视觉领域的一个基础且具有挑战的任务,人体姿态估计对于描述人体姿态,人体行为等至关重要。随着深度学习技术的发展，以堆叠沙漏网络为代表的基于多尺度特征融合的人体姿态估计算法表现出了优越的性能，在姿态估计领域具有重要地位。
[0003]但是现有的基于堆叠沙漏网络的人体姿态估计模型，具有较大的信息损失，仍存在较大改进空间。

技术实现思路

[0004]本专利技术提供了一种姿态估计模型的训练与姿态估计方法、装置、设备及介质，在特征提取网络中增加具有多个特征提取尺度的空间金字塔池化模块，为姿态估计提供提取同一层更高精度的多尺度特征，从而提高基于堆叠沙漏网络的姿态估计模型的姿态估计精度。
[0005]根据本专利技术的一方面，提供了一种姿态估计模型的训练方法，包括：获取图像样本集；通过所述图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型；其中，所述初始姿态估计模型包括：特征提取网络和堆叠沙漏网络；所述特征提取网络包括：特征提取模块和空间金字塔池化模块；所述空间金字塔池化模块包括：并联的第一特征提取单元和第二特征提取单元，以及特征融合单元；所述第一特征提取单元和所述第二特征提取单元设置不同的特征提取尺度。
[0006]根据本专利技术的另一方面，提供了一种姿态估计方法,包括：获取待解析图像；...

【技术保护点】

【技术特征摘要】
1.一种姿态估计模型的训练方法，其特征在于，包括：获取图像样本集；通过所述图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型；其中，所述初始姿态估计模型包括：特征提取网络和堆叠沙漏网络；所述特征提取网络包括：特征提取模块和空间金字塔池化模块；所述空间金字塔池化模块包括：并联的第一特征提取单元和第二特征提取单元，以及特征融合单元；所述第一特征提取单元和所述第二特征提取单元设置不同的特征提取尺度。2.根据权利要求1所述的方法，其特征在于，所述第一特征提取单元包括：至少一个第一卷积层；所述第二特征提取单元包括：串联的第一预设数量的第二卷积层和金字塔池化层。3.根据权利要求2所述的方法，其特征在于，所述第一预设数量为3个； 3个第二卷积层的卷积核均为11，所述3个第二卷积层中的第1个卷积层和第2个卷积层连接，所述第2个卷积层与所述金字塔池化层连接；所述金字塔池化层与第3个卷积层连接；所述金字塔池化层包括：至少两个并联的最大池化层，各所述最大池化层的卷积核尺度不同。4.根据权利要求1所述的方法，其特征在于，所述特征提取模块包括：第一预设数量的下采样层和第二预设数量的特征提取层；所述下采样层为卷积层。5.根据权利要求1所述的方法，其特征在于，所述初始姿态估计模型中的所述堆叠沙漏网络包括：第三预设数量的沙漏网络；所述第三预设数量小于最佳设置数量；所述通过所述图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型包括：将所述图像样本集中的第一图像样本集确定为目标图像样本集，将所述初始姿态估计模型确定为待训练模型；通过所述目标图像样本集迭代训练所述待训练模型，得到有效姿态估计模型；将所述有效姿态估计模型中堆叠沙漏网络的沙漏网络个数增加至最佳设置数量；将所述图像样本集中的第二图像样本集确定为目标图像样本集，将包含最佳设置数量的沙漏网络的有效姿态估计模型确定为待训练模型；返回执行通过所述目标图像样本集迭代训练所述待训练模型的操作，得到目标姿态估计模型。6.根据权利要求5所述的方法，其特征在于，所述通过所述目标图像样本集迭代训练所述待训练模型的操作包括：将所述目标图像样本集中的样本图像输入所述待训练模型的特征提取模块进行特征提取，得到第一特征图像；将所述第一特征图像分别输入所述待训练模型的空间金字塔池化模块中的第一特征单元和第二特征单元，将所述第一特征单元输出的第二特征图像和所述第二特征单元输出的第三特征图像输入所述待训练模型的空间金字塔池化模块中的特征融合单元得到目标特征图像；将所述目标特征图像输入所述待训练模型的堆叠沙漏网络获得所述样本图像的定位图和偏置图，根据所述定位图和所述偏置图确定所述样本图像中目标体的各关键点的估计坐标；
根据各所述关键点的估计坐标和各所述关键点的真实坐标计算损失函数值，并基于损失函数值对待训练模型中的网络参数进行调整；返回执行将所述目标图像样本集中的样本图像输入所述待训练模型的特征提取模块进行特征提取的操作，直到达到预设条件。7.根据权利要求6所述的方法，其特征在于，所述偏置图包括：第一方向偏置图和第二...

【专利技术属性】
技术研发人员：简春兵，龚凡，黄瑞琪，
申请(专利权)人：深圳金信诺高新技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人