姿态估计模型的训练与姿态估计方法、装置、设备及介质制造方法及图纸

技术编号:33407358 阅读:24 留言:0更新日期:2022-05-11 23:31
本发明专利技术公开了一种姿态估计模型的训练与姿态估计方法、装置、设备及介质方法、装置、设备及存储介质,该方法包括:获取图像样本集;通过图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型;其中,初始姿态估计模型包括:特征提取网络和堆叠沙漏网络;特征提取网络包括:特征提取模块和空间金字塔池化模块;空间金字塔池化模块包括:并联的第一特征提取单元和第二特征提取单元,以及特征融合单元;第一特征提取单元和第二特征提取单元设置不同的特征提取尺度,能够为姿态估计提供提取同一层更高精度的多尺度特征,从而提高基于堆叠沙漏网络的姿态估计模型的姿态估计精度。沙漏网络的姿态估计模型的姿态估计精度。沙漏网络的姿态估计模型的姿态估计精度。

【技术实现步骤摘要】
姿态估计模型的训练与姿态估计方法、装置、设备及介质


[0001]本专利技术涉及计算机技术
,尤其涉及一种姿态估计模型的训练与姿态估计方法、装置、设备及介质。

技术介绍

[0002]人体姿态估计是计算机视觉领域的一个基础且具有挑战的任务,人体姿态估计对于描述人体姿态,人体行为等至关重要。随着深度学习技术的发展,以堆叠沙漏网络为代表的基于多尺度特征融合的人体姿态估计算法表现出了优越的性能,在姿态估计领域具有重要地位。
[0003]但是现有的基于堆叠沙漏网络的人体姿态估计模型,具有较大的信息损失,仍存在较大改进空间。

技术实现思路

[0004]本专利技术提供了一种姿态估计模型的训练与姿态估计方法、装置、设备及介质,在特征提取网络中增加具有多个特征提取尺度的空间金字塔池化模块,为姿态估计提供提取同一层更高精度的多尺度特征,从而提高基于堆叠沙漏网络的姿态估计模型的姿态估计精度。
[0005]根据本专利技术的一方面,提供了一种姿态估计模型的训练方法,包括:获取图像样本集;通过所述图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型;其中,所述初始姿态估计模型包括:特征提取网络和堆叠沙漏网络;所述特征提取网络包括:特征提取模块和空间金字塔池化模块;所述空间金字塔池化模块包括:并联的第一特征提取单元和第二特征提取单元,以及特征融合单元;所述第一特征提取单元和所述第二特征提取单元设置不同的特征提取尺度。
[0006]根据本专利技术的另一方面,提供了一种姿态估计方法,包括:获取待解析图像;将所述待解析图像输入采用姿态估计模型的训练方法训练得到的目标姿态估计模型;获取所述目标姿态估计模型输出的所述待解析图像的目标定位图和目标偏置图;基于所述目标定位图和所述目标偏置图确定所述待解析图像中目标体的各关键点的估计坐标,根据各所述关键点的估计坐标估计所述目标体的姿态。
[0007]根据本专利技术的另一方面,提供了一种姿态估计模型的训练装置,包括:获取模块,用于获取图像样本集;训练模块,用于通过所述图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型;其中,所述初始姿态估计模型包括:特征提取网络和堆叠沙漏网络;所述特征提取网络包括:特征提取模块和空间金字塔池化模块;所述空间金字塔池化模块包括:并联的第
一特征提取单元和第二特征提取单元,以及特征融合单元;所述第一特征提取单元和所述第二特征提取单元设置不同的特征提取尺度。
[0008]根据本专利技术的另一方面,提供了一种姿态估计装置,包括:第一获取模块,用于获取待解析图像;输入模块,用于将所述待解析图像输入采用姿态估计模型的训练方法训练得到的目标姿态估计模型;第二获取模块,用于获取所述目标姿态估计模型输出的所述待解析图像的目标定位图和目标偏置图;姿态估计模块,用于基于所述目标定位图和所述目标偏置图确定所述待解析图像中目标体的各关键点的估计坐标,根据各所述关键点的估计坐标估计所述目标体的姿态。
[0009]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的姿态估计模型的训练方法和/或姿态估计方法。
[0010]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的姿态估计模型的训练方法和/或姿态估计方法。
[0011]本专利技术实施例的技术方案,通过获取图像样本集;通过图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型;其中,初始姿态估计模型包括:特征提取网络和堆叠沙漏网络;特征提取网络包括:特征提取模块和空间金字塔池化模块;空间金字塔池化模块包括:并联的第一特征提取单元和第二特征提取单元,以及特征融合单元;第一特征提取单元和第二特征提取单元设置不同的特征提取尺度,能够为姿态估计提供提取同一层更高精度的多尺度特征,从而提高基于堆叠沙漏网络的姿态估计模型的姿态估计精度。
[0012]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1是根据本专利技术实施例一提供的一种姿态估计模型的训练方法的流程图;图2A是根据本专利技术实施例一提供的一种姿态估计模型的结构示意图;图2B是根据本专利技术实施例二提供的一种姿态估计模型的结构示意图;图2C是根据本专利技术实施例二提供的一种空间金字塔池化模块的结构示意图;图3A是根据本专利技术实施例三提供的一种姿态估计模型的训练方法的流程图;图3B是根据本专利技术实施例三提供的一种训练待训练模型的示意图;
图4是根据本专利技术实施例四提供的一种姿态估计方法的流程图;图5是根据本专利技术实施例五提供的一种姿态估计模型的训练装置的结构示意图;图6是根据本专利技术实施例六提供的一种姿态估计装置的结构示意图;图7是实现本专利技术实施例的姿态估计模型的训练方法的电子设备的结构示意图。
具体实施方式
[0015]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0016]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0017]实施例一图1为本专利技术实施例一提供了一种姿态估计模型的训练方法的流程图,本实施例可适用于训练姿态估计模型的情况,该方法可以由姿态估计模型的训练装置来执行,该姿态估计模型的训练装置可以采用硬件和/或软件的形式实现,该姿态估计模型的训练装置可配置于电子设备中。
[0018]如图1所示,该方法具体包括如下步骤:S110、获取图像样本集。
[0019]其中,图像样本集是用于训练初始姿态估计模型的样本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种姿态估计模型的训练方法,其特征在于,包括:获取图像样本集;通过所述图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型;其中,所述初始姿态估计模型包括:特征提取网络和堆叠沙漏网络;所述特征提取网络包括:特征提取模块和空间金字塔池化模块;所述空间金字塔池化模块包括:并联的第一特征提取单元和第二特征提取单元,以及特征融合单元;所述第一特征提取单元和所述第二特征提取单元设置不同的特征提取尺度。2.根据权利要求1所述的方法,其特征在于,所述第一特征提取单元包括:至少一个第一卷积层;所述第二特征提取单元包括:串联的第一预设数量的第二卷积层和金字塔池化层。3.根据权利要求2所述的方法,其特征在于,所述第一预设数量为3个; 3个第二卷积层的卷积核均为11,所述3个第二卷积层中的第1个卷积层和第2个卷积层连接,所述第2个卷积层与所述金字塔池化层连接;所述金字塔池化层与第3个卷积层连接;所述金字塔池化层包括:至少两个并联的最大池化层,各所述最大池化层的卷积核尺度不同。4.根据权利要求1所述的方法,其特征在于,所述特征提取模块包括:第一预设数量的下采样层和第二预设数量的特征提取层;所述下采样层为卷积层。5.根据权利要求1所述的方法,其特征在于,所述初始姿态估计模型中的所述堆叠沙漏网络包括:第三预设数量的沙漏网络;所述第三预设数量小于最佳设置数量;所述通过所述图像样本集迭代训练初始姿态估计模型得到目标姿态估计模型包括:将所述图像样本集中的第一图像样本集确定为目标图像样本集,将所述初始姿态估计模型确定为待训练模型;通过所述目标图像样本集迭代训练所述待训练模型,得到有效姿态估计模型;将所述有效姿态估计模型中堆叠沙漏网络的沙漏网络个数增加至最佳设置数量;将所述图像样本集中的第二图像样本集确定为目标图像样本集,将包含最佳设置数量的沙漏网络的有效姿态估计模型确定为待训练模型;返回执行通过所述目标图像样本集迭代训练所述待训练模型的操作,得到目标姿态估计模型。6.根据权利要求5所述的方法,其特征在于,所述通过所述目标图像样本集迭代训练所述待训练模型的操作包括:将所述目标图像样本集中的样本图像输入所述待训练模型的特征提取模块进行特征提取,得到第一特征图像;将所述第一特征图像分别输入所述待训练模型的空间金字塔池化模块中的第一特征单元和第二特征单元,将所述第一特征单元输出的第二特征图像和所述第二特征单元输出的第三特征图像输入所述待训练模型的空间金字塔池化模块中的特征融合单元得到目标特征图像;将所述目标特征图像输入所述待训练模型的堆叠沙漏网络获得所述样本图像的定位图和偏置图,根据所述定位图和所述偏置图确定所述样本图像中目标体的各关键点的估计坐标;
根据各所述关键点的估计坐标和各所述关键点的真实坐标计算损失函数值,并基于损失函数值对待训练模型中的网络参数进行调整;返回执行将所述目标图像样本集中的样本图像输入所述待训练模型的特征提取模块进行特征提取的操作,直到达到预设条件。7.根据权利要求6所述的方法,其特征在于,所述偏置图包括:第一方向偏置图和第二...

【专利技术属性】
技术研发人员:简春兵龚凡黄瑞琪
申请(专利权)人:深圳金信诺高新技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1