基于注意力机制融合多流图的人体姿态预测方法及系统技术方案

技术编号：30779029 阅读：69 留言：0更新日期：2021-11-16 07:39

本发明专利技术涉及一种基于注意力机制融合多流图神经网络的人体姿态预测方法及系统，其方法包括：S1：获取用于训练的人体关键关节的三维位置数据序列，根据预设的输入序列和输出序列的长度，分为输入序列和输出序列；根据输入序列构建图数据；S2：构建基于注意力机制融合多流图神经网络模型；将图数据输入该模型进行训练，得到训练好的模型；S3：获取用于预测的人体关键关节的三维位置数据序列，构建图数据，输入训练好的基于注意力机制融合多流图神经网络模型，得到人体姿态的预测值。本发明专利技术提出的方法，基于人体关节位置数据及结构特征，构建多个图模型，实现了对人体运动系统的建模，以对人体姿态进行预测，并达到了较高的准确率。并达到了较高的准确率。并达到了较高的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
基于注意力机制融合多流图的人体姿态预测方法及系统

[0001]本专利技术涉及计算机视觉和图像处理领域，具体涉及一种基于注意力机制融合多流图神经网络的人体姿态预测方法及系统。

技术介绍

[0002]近年来，随着成本较低的消费级深度相机的广泛使用，人体三维运动姿态的低成本、实时采集成为了可能，因此人体姿态预测成为了图形学与计算机视觉交叉的热点问题，并在机器人领域、医疗领域、自动驾驶技术上有着广阔的应用前景和丰富的应用场景。
[0003]在机器人领域，外骨骼机器人相关技术是研究的一大热点，在航空航天中有着非常重要的应用，被认为是开展在轨建造、维修及月面和火星表面活动的关键支撑装备，对于航天出舱任务的完成和应急故障处置都会发挥极为重要的作用。人体姿态预测算法通过对人体运动规律进行识别分析，对航天员的运动意图进行判断和预测，辅助外骨骼机器人完成力柔顺控制，减少外骨骼机器人控制中出现的力突变，从而有效地提高航天服对航天员运动的适应性。
[0004]运动捕捉技术早在五十年前就已问世，广泛应用于影视和游戏等娱乐行业，同时也在医疗健康行业帮助着具有运动障碍的患者。但目前，人们仍然无法脱离真实的运动捕捉数据去生成逼真的、符合人体结构特点和运动平衡状态的云中数据，但是目前主流的运动捕捉技术仍然是基于惯性传感器或复杂的光学传感系统的，存在造价高、需要专业场地等劣势，距离“飞入寻常百姓家”，造福需要依靠辅助器械完成日常运动的患者们，还有很远的距离。人体姿态预测算法应用于运动生成技术中，可以大大提高运动捕捉数据的利用率，降低运动...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制融合多流图神经网络的人体姿态预测方法，其特征在于，包括：步骤S1：获取用于训练的人体关键关节的三维位置数据序列，根据预设的输入序列和输出序列的长度，将三维位置数据序列分割为所述输入序列和所述输出序列；根据所述输入序列构建图数据；步骤S2：构建基于注意力机制融合多流图神经网络模型；将所述图数据输入所述基于注意力机制融合多流图神经网络模型进行训练，得到训练好的所述基于注意力机制融合多流图神经网络模型；步骤S3：获取用于预测的人体关键关节的三维位置数据序列，构建所述图数据，输入训练好的所述基于注意力机制融合多流图神经网络模型，得到人体姿态的预测值。2.根据权利要求1所述的基于注意力机制融合多流图神经网络的人体姿态预测方法，其特征在于，所述步骤S1：获取用于训练的人体关键关节的三维位置数据序列，根据预设的输入序列和输出序列的长度，将三维位置数据序列分割为所述输入序列和所述输出序列；根据所述输入序列构建图数据，具体包括：步骤S11：获取用于训练的人体关键关节的三维位置的数据序列f
×
n
×
3，其中，f表示所述数据序列的帧数，n表示关节数量；步骤S12：将所述数据序列的前t帧数据作为所述输入序列，(f
‑
t)帧数据作为所述输出序列；其中，所述输入序列表示为t
×
n
×
3；所述输出序列表示为(f
‑
t)
×
n
×
3；步骤S13：根据所述输入序列t
×
n
×
3构建节点矩阵V以及邻接矩阵A，并由此构建全连接图G
all
＝(V,A
all
)、高自由度关节连接图G
mobile
＝(V,A
mobile
)和低自由度关节连接图G
stable
＝(V,A
stable
)；其中，A
all
表示全部关节间联系关系的全连接邻接矩阵，A
mobile
表示高自由度关节间联系关系的高自由度关节邻接矩阵，A
stable
表示低自由度关节间联系的低自由度关节邻接矩阵。3.根据权利要求1所述的基于注意力机制融合多流图神经网络的人体姿态预测方法，其特征在于，所述步骤S2：构建基于注意力机制融合多流图神经网络模型；将所述图数据输入所述基于注意力机制融合多流图神经网络模型进行训练，得到训练好的所述基于注意力机制融合多流图神经网络模型，具体包括：步骤S21：所述的基于注意力机制融合多流图神经网络采用编码器和解码器结构，其中，所述编码器包含多个编码模块；将所述图数据输入所述编码器进行特征提取，所述编码模块的输出如下述公式(4)所示：Out
i
＝Att
i
(GCN
all1
(G
all
),GCN
stable1
(G
stable
),GCN
mobile1
(G
mobile
)) (4)其中，第i个编码模块的输出Out
i
＝(G
all1
,G
stable1
,G
mobile1
)包含三个图数据；GCN(
·
)表示单个图神经网络层；Att
i
(
·
)表示第i个注意力模块；步骤S22：所述单个图神经网络层的输入为G＝(V,A)，输出为X，表示为如下公式(5):X＝ReLU(AVW+VU) (5)其中，W和U为可训练的权重矩阵，其大小为(t
×
3)
×
D，D为期望图神经网络层的输出的特征维数；步骤S23：所述注意力模块的输入为G1＝(V1,A
all
),G2＝(V2,A
stable
),G3＝(V3,A
mobile
)，输出为X...

【专利技术属性】
技术研发人员：袁丁，曹哲，魏晓东，尹继豪，张雪怡，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人