单视角三维人体骨骼关键点检测方法、装置、设备及介质制造方法及图纸

技术编号：35981081 阅读：19 留言：0更新日期：2022-12-17 22:51

本发明专利技术提出一种单视角三维人体骨骼关键点检测方法、装置、设备及介质，包括：获取单视角人体图像序列，单视角人体图像序列包括目标图像和相关图像；分别获取所述目标图像的第一骨骼关键点和相关图像的第二骨骼关键点，对第一骨骼关键点进行空间特征提取得到空间语义特征，并对第一骨骼关键点和第二骨骼关键点进行时序特征提取得到时序特征；将监督特征与空间语义特征、时序特征进行融合，得到三维人体骨骼关键点特征信息。本发明专利技术中，提取空间语义特征和时序特征，获得骨骼关键点的平面信息与深度信息；将监督特征与空间语义特征、时序特征进行融合，可有效减轻单视角图像二维人体骨骼关键点映射三维人体骨骼关键点的深度模糊性和不适定性。性和不适定性。性和不适定性。

全部详细技术资料下载

【技术实现步骤摘要】
单视角三维人体骨骼关键点检测方法、装置、设备及介质

[0001]本专利技术涉及计算机视觉领域，尤其涉及一种单视角三维人体骨骼关键点检测方法、装置、设备及介质。

技术介绍

[0002]三维人体骨骼关键点检测是计算机视觉领域的基本问题和研究热点之一，其任务是获取目标视频帧中人体骨骼关键点在三维立体空间中的位置和连接信息，是众多视觉任务如场景理解、行为识别、行人重识别等的基础技术，被广泛应用于视频监控、行为识别、在线教学、动作捕捉、虚拟现实、医疗辅助等领域。
[0003]在单视角图像三维人体骨骼关键点检测中，由于图像视角的单一性，图像从三维空间投影到二维平面时会丢失深度信息，可能导致多个不同的三维人体骨骼关键点投影到同一个二维关键点。因此单视角图像中，人体骨骼信息从二维空间到三维空间的映射存在深度模糊性和不适定性，二维关键点的微小定位误差也可能导致在三维空间中产生较大的姿态畸变。
[0004]现有的单视角三维人体骨骼关键点检测方法主要包括直接估计法和二维到三维提升方法。
[0005]直接估计法一般是设计一个端到端网络直接从输入的二维图像中推断出三维人体骨骼关键点，不需要对二维人体信息表示进行中间估计。该方法虽然能从图像中获取到丰富的信息，但缺乏二维人体骨骼信息到三维人体骨骼信息的中间监督过程，需要较大数量的三维标注数据来训练性能优越的模型。
[0006]二维到三维提升方法首先采用二维人体骨骼关键点检测模型来估计二维骨骼关键点信息，然后利用二维骨骼信息与三维图像特征融合、三维空间重投影等二维到...

【技术保护点】

【技术特征摘要】
1.一种单视角三维人体骨骼关键点检测方法，其特征在于，包括：获取单视角人体图像序列，所述单视角人体图像序列包括预设时间段内同一目标对象在不同姿态下的多帧图像，其中一帧图像作为目标图像，其余图像作为所述目标图像的相关图像；分别获取所述目标图像的第一骨骼关键点和所述相关图像的第二骨骼关键点，对所述第一骨骼关键点进行空间特征提取得到空间语义特征，并对所述第一骨骼关键点和第二骨骼关键点进行时序特征提取得到时序特征，所述空间语义特征包括全局语义特征和局部语义特征；将监督特征与所述空间语义特征、时序特征进行融合，得到三维人体骨骼关键点特征信息，所述监督特征通过特征提取网络提取所述目标图像中的信息得到，所述监督特征包括所述目标图像的深层语义信息、纹理信息和边缘信息。2.根据权利要求1所述的单视角三维人体骨骼关键点检测方法，其特征在于，对所述第一骨骼关键点进行空间特征提取得到空间语义特征，包括：根据所述第一骨骼关键点构建全局空间图和全局邻接矩阵；通过多头注意力机制挖掘所述全局空间图的权重矩阵，并利用空洞卷积网络得到所述全局空间图中多个感受野的多维特征；利用图卷积网络更新所述全局邻接矩阵，得到第一矩阵；结合所述权重矩阵、多维特征和第一矩阵构建多头注意力全局空间图；对所述多头注意力全局空间图进行特征表示，得到所述全局语义特征。3.根据权利要求1所述的单视角三维人体骨骼关键点检测方法，其特征在于，对所述第一骨骼关键点进行空间特征提取得到空间语义特征，包括：根据所述第一骨骼关键点的局部连接关系构建多个局部邻接矩阵，通过图卷积网络更新所述多个局部邻接矩阵，得到多个第二矩阵；根据所述多个第二矩阵构建多个局部空间图，对所述多个局部空间图进行特征表示得到所述局部语义特征。4.根据权利要求1所述的单视角三维人体骨骼关键点检测方法，其特征在于，对所述第一骨骼关键点和第二骨骼关键点进行时序特征提取得到时序特征，包括：构建所述第一骨骼关键点和第二骨骼关键点的时序邻接矩阵，通过图卷积网络更新所述时序邻接矩阵，得到第三矩阵；通过所述第三矩阵构建时序图，对所述时序图进行特征表示，得到所述时序特征。5.根据权利要求1所述的单视角三维人体骨骼关键点检测方法，其特征在于，将监督特征与所述空间语义特征、时序特征进行融合，得到三维人体骨骼关键点特征信息，包括：将所述全局语义特征和局部语义特征作为所述监督特征的注意力因子，联结所述全局语义特征和局部语义特征形成目标图像的第一空间结构特征，利用...

【专利技术属性】
技术研发人员：张丽君，徐卉，周祥东，石宇，罗代建，程俊，
申请(专利权)人：中国科学院重庆绿色智能技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人