基于注意力编码器的姿态估计方法、装置、设备及介质制造方法及图纸

技术编号:31789266 阅读:25 留言:0更新日期:2022-01-08 10:46
本申请公开了一种基于注意力编码器的姿态估计方法、装置、设备及介质。该方法包括通过获取具有一个待识别目标的目标图片,将目标图片输入至目标检测网络得到待识别目标的多个2D关键点坐标;将得到的每个2D关键点坐标以及预设的人体3D关键点模板信息通过全连接神经网络得到所述每个2D关键点坐标对应的embedding特征向量;并将embedding特征向量输入到编码器进行编码,得到编码向量,再将编码向量输入至全连接神经网络,从而确定待识别目标的3D关键点坐标。可以看出,相比于现有技术本申请通过基于注意力编码器架构及人体3D关键点模板信息的方法提高了对人体3D姿态估计的准确性。的准确性。的准确性。

【技术实现步骤摘要】
基于注意力编码器的姿态估计方法、装置、设备及介质


[0001]本专利技术涉及人工智能领域,特别涉及一种基于注意力编码器的姿态估计方法、装置、设备及介质。

技术介绍

[0002]三维人体姿态估计是从二维图像中识别出人体所做出的三维动作的技术。
[0003]现有技术中,通常有两类方法:一是采用端到端的卷积神经网络,直接从输入图像中预测人体的3D关节点位置,二是先通过卷积神经网络估计2D关节点位置,再将2D关节点位置输入2D

3D转换神经网络,估计3D关节点位置。由于近年来2D关节点位置估计算法准确度的提升,进一步可带来3D关节点位置估计的提升,然而现有技术对人体3D姿态的估计可能不够准确。

技术实现思路

[0004]基于此,本申请实施例提供了一种基于注意力编码器的姿态估计方法、装置、设备及介质,可以解决现有技术对人体3D姿态估计不准确的问题。
[0005]第一方面,提供了一种基于注意力编码器的人体3D姿态识别方法,该方法包括:
[0006]获取目标图片,所述目标图片中包括一个待识别目标;<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于注意力编码器的人体3D姿态识别方法,其特征在于,所述方法包括:获取目标图片,所述目标图片中包括一个待识别目标;将所述目标图片输入至目标检测网络得到所述待识别目标的多个2D关键点坐标;将所述待识别目标的每个2D关键点坐标以及预设的人体3D关键点模板信息通过全连接神经网络得到所述每个2D关键点坐标对应的embedding特征向量;将所述embedding特征向量输入到编码器进行编码,得到编码向量,所述embedding特征向量的个数与所述编码器的节点个数相同;将所述编码向量输入至所述全连接神经网络,确定所述待识别目标的3D关键点坐标。2.根据权利要求1所述的方法,其特征在于,所述编码器包括四层,所述将所述embedding特征向量输入到编码器进行编码,得到编码向量,包括:将所述embedding特征向量输入至第一编码器进行编码,得到第一编码向量;将所述第一编码向量输入至第二编码器进行编码,得到第二编码向量;将所述第二编码向量输入至第三编码器进行编码,得到第三编码向量;将所述第三编码向量输入至第四编码器进行编码,得到编码向量。3.根据权利要求2所述的方法,其特征在于,所述第一编码器、所述第二编码器、所述第三编码器以及所述第四编码器具有相同的结构。4.根据权利要求1所述的方法,其特征在于,所述预设的人体3D关键点模板信息包括预设的人体3D关键点坐标,通过选取SMPL平均人体模型中Tpose状态下的3D关键点坐标作为模板信息。5.根据...

【专利技术属性】
技术研发人员:宋波
申请(专利权)人:北京影谱科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1