【技术实现步骤摘要】
基于注意力机制的图卷积神经网络的动作识别方法
[0001]本专利技术涉及视频动作识别
,具体而言涉及基于注意力机制的图卷积神经网络的动作识别方法。
技术介绍
[0002]在机器学习领域,动作识别是一项非常重要的任务,在日常生活中有很多场景能够使用到,比如自动驾驶、人机交互、公共安全等,因此,这项任务受到了越来越多的人关注。从目前来看,由于近几年机器学习与深度学习的爆发式发展,涌现出了很多性能优良的动作识别算法,基于时空图卷积的动作识别算法取得了优良的成绩。
[0003]人体运动平衡的理论中这样描述,人在运动过程中,为了保证自身不会摔倒,身体需要不断调整姿态来保持重心位置基本不变,尤其是对于运动员来说,可以通过甩臂,伸腿等动作来维持自身平衡。对于普通人来说,日常的行为动作,同样也需要保持平衡,需要四肢与躯干的配合,才能保证人不会摔倒在地。因此,人在完成某一动作的过程中,四肢有大致固定的运动轨迹,例如“奔跑”这一动作中,左脚迈向前时,右臂就必须往后摆,这样才能保持自身的重心位置不变,否则将会有摔倒的风险。
[0004]另外,人体不同的动作,不同关节之间的重要性是不同的,而这些较为重要的关节往往也不止一个,现有的模型未能很好地关注这部分特征的提取。另外,由于人体物理连接的固定性,图卷积神经网络在提取特征时往往会被固定化,未能更好地从全局视角关注较为重要的几个关节之间相互的特征,这些关节在绝大多数动作中往往是不相连的,例如在“拍手”这一动作中,从人体骨骼图上来看,双手的节点没有直接相连,并且相距甚远,但 ...
【技术保护点】
【技术特征摘要】
1.基于注意力机制的图卷积神经网络的动作识别方法,其特征在于,包括如下步骤:步骤1,获取待识别人体动作类型的视频流数据,由姿态估计算法得到人体骨骼类型数据,作为人体骨骼数据集,步骤2,构建协调性注意力模块,计算人体运动过程中四肢及躯干所产生的协调性特征,获取带有协调性特征的重心矩阵,并添加到人体骨骼数据集中,步骤3,人体骨骼数据集输入到双流图卷积神经网络中,输出预测动作。2.根据权利要求1所述基于注意力机制的图卷积神经网络的动作识别方法,其特征在于,步骤2中的协调性注意力模块用于对人体骨骼分区、重心矩阵计算和协调性矩阵计算,从而获取带有协调性特征的重心矩阵,具体包括如下步骤:步骤2.1,根据人体的结构将人体骨骼图分成5个区域,5个区域分别对应头部、左臂、右臂、左腿和右腿,得到5个区域子图;步骤2.2,计算每个区域的重心点;使用如下公式计算各区域重心点坐标:式中,w
x
区域重心点的横坐标,x
n
表示该区域内各个关节点的横坐标,n表示该区域内关节点的标号,n=1,2,
…
,n;另外,区域重心点y坐标和z坐标的计算方法均与上式相同;,n;另外,区域重心点y坐标和z坐标的计算方法均与上式相同;从而得到的重心矩阵如下形式所示:(w1,w2,w3,w4,w5)步骤2.3,根据协方差矩阵计算两两区域之间的协调性;协方差矩阵计算公式如下:w
i
、w
j
分别表示(w1,w2,w3,w4,w5),i=1,2
……
5,如下形式所示:式中cov(
·
)表示协方差的计算结果,w
i
和w
j
表示区域重心点的坐标,表示各区域重心点坐标的平均数;步骤S2.4,根据上述公式计算出协调性矩阵,协调性矩阵的形式如下所示:步骤S2.5,根据步骤2.4即可得到3组大小为5
×
5协调性矩阵,分别将这3组协调性矩阵表示为w
x
,w
y
,和w
z
,这3组矩阵即可用来表示身体的协调性特征;将w
x
,w
y
,和w
z
压缩成与重心
矩阵维度相同的大小,这里的压缩方法采用逐列相加的形式进行,以第一列为例,举例具体说明压缩方法如下形式所示:w1′
=cov(w1,w1)+cov(w2,w1)+cov(w3,w1)+cov(w4,w1)+cov(w5,w1)步骤S2.6,将重心矩阵与压缩后的协调性矩阵相加,得到带有协调性特征的重心矩阵其中,其中,其中,其中,其中,3.根据权利要求1所述基于注意力机制的图卷积神经网络的动作识别方法,其特征在于,在步骤3中的所述双流图卷积神经网络包括重要性注意力模块,构建带有重要性注意力模块的双流图卷积神经网络;包括如下步骤步骤3.1,构建自适应图卷积模块,所述自适应图卷积模块包括依次连接的空间图卷积层convs、时间图卷积层convt、附加的随机丢弃处理Dropout和一个残差连接;另外,空间图卷积层和时间卷积层后面各连接有一个批标准化层和一个激活函数层;步骤3.2,搭建带有重要性注意力模块的自适应...
【专利技术属性】
技术研发人员:翟晓东,汝乐,凌涛,凌婧,
申请(专利权)人:江苏奥斯汀光电科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。