【技术实现步骤摘要】
一种基于自注意力机制和Bi
‑
GRU的人体动作识别方法
[0001]本专利技术属于人体动作识别领域,特别涉及一种基于自注意力机制和Bi
‑
GRU的人体动作识别方法。
技术介绍
[0002]人体动作识别指根据传感器得到的数据,将运动分类为预定义的人体动作类别。在健康监视系统、远程医疗保健、运动检测等领域已有非常重要的作用。基于惯性传感器的人体动作识别具有不受外界干扰、不受场景限制、抗干扰能力强等优点,更加适合日常运动和军事运用。
[0003]深度学习的提出使得机器学习取得了突破性的进展,也为人体动作识别带来了新发展方向。深度学习能自动从原始数据中学习深层次的特征,解决了传统机器学习的特征提取依赖研究人员先验知识导致算法泛化能力差的问题。
[0004]基于卷积神经网络和循环神经网络的人体动作识别技术是目前基于深度学习的人体动作识别技术中使用较多的技术。卷积神经网络能提取空间特征,循环神经网络能提取时间特征。但仍存在以下问题:1.对于人体动作识别这样一个时间关联强的任务来说,卷积网络提取的空间特征不够有效,导致对复杂动作识别准确率低。2.卷积网络计算复杂度太大、参数量太多。3.循环神经网络难以提取时间间隔较长的数据之间的时间特征,导致人体动作识别精度不够高。因此需要提出一种新的特征提取、识别方法,以提高人体动作识别精度和降低算法复杂度。
[0005]本专利技术和专利CN114639169A有本质的差异。本专利技术的数据源是惯性的传感的,CN114639169A使用 ...
【技术保护点】
【技术特征摘要】
1.一种基于自注意力机制和Bi
‑
GRU的人体动作识别方法,其特征在于,包括以下步骤:S1:记录人体动作的惯性传感器数据,并通过滑动窗口截取数据和数据对应的动作类别标签;S2:构建一个Encoder
‑
Decoder模型;所述Encoder
‑
Decoder模型包括Encoder和Decoder,将数据输入Encoder编码器中进行编码,通过Encoder编码器中的多头自注意力层提取输入数据之间的时间关联特征,再与原始输入数据进行拼接;S3:Decoder解码:所述Decoder译码器包括双向门控循环单元Bi
‑
GRU、全连接层、Softmax层,将Encoder的输出数据,输入双向门控循环单元Bi
‑
GRU进行进一步时间顺序特征提取;全连接层将特征整合为向量,Softmax层将全连接层输出转化为概率分布;S4:将Bi
‑
GRU的输出特征,输入全连接层得到一个输出向量,该输出向量维度为分类标签总数,向量第N维数值为输入惯性传感器数据对应的动作为第N种动作的可能性;S5:根据样本数据对模型进行训练,再将未知分类标签的惯性传感器数据输入已训练好的模型,得到其人体动作类别。2.根据权利要求1所述的一种基于自注意力机制和Bi
‑
GRU的人体动作识别方法,其特征在于,所述S1具体包括:利用位于躯干的惯性传感器记录关于人体动作的惯性传感器时序数据,并设置一定长度的滑动窗口,截取相应长度的数据以及每个滑动窗口对应的人体动作类别。3.根据权利要求1所述的一种基于自注意力机制和Bi
‑
GRU的人体动作识别方法,其特征在于,所述步骤S2中的多头自注意力层包含三个全连接层:query查询、key键、value值,输入数据通过这三个全连接层分别得到Q、K、V矩阵,然后通过进一步计算得到Attention
‑
Score注意力得分矩阵,为保证Bi
‑
GRU能学习到原始数据的时域特征,将Attention
‑
Score矩阵与原始数据在最后一维上拼接,得到Encoder的输出。4.根据权利要求3所述的一种基于自注意力机制和Bi
‑
GRU的人体动作识别方法,其特征在...
【专利技术属性】
技术研发人员:路永乐,修蔚然,韩亮,杨杰,孙旗,罗毅,彭慧,刘宇,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。