一种基于深度学习的人体行为识别方法及系统技术方案

技术编号：36046224 阅读：26 留言：0更新日期：2022-12-21 10:54

本发明专利技术涉及人体行为识别方法，更具体地，涉及一种基于深度学习的人体行为识别方法及系统，通过IMU传感器可十分便捷地获取人体行为数据，将人体行为数据传输至IMUT网络模型，通过IMUT网络模型识别人体行为，最终将对应的人体行为识别结果输出，本发明专利技术利用IMU传感器，降低了获取信息门槛，不需通过视觉信息进行人体识别，不易受到干扰，且能降低模型训练和推理所消耗的资源。理所消耗的资源。理所消耗的资源。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的人体行为识别方法及系统

[0001]本专利技术涉及人体行为识别的
，更具体地，涉及一种基于深度学习的人体行为识别方法及系统。

技术介绍

[0002]人体行为识别可以应用于多个领域，例如虚拟现实、增强现实、医疗保健，安防等场景，随着深度学习技术的发展，越来越多的领域都使用到了深度学习技术，并且都取得了非常好的效果，人体行为识别领域也不例外，在目前的人体行为识别中，主要有3个方向使用了深度学习算法，分别是RGB视频、深度视频和3D骨架。现有的现有的人体行为识别算法都是需要视频作为输入的，获取信息门槛较高；基于RGB视频输入很容易受到异常的干扰，例如少部分身体的遮挡甚至全部身体的遮挡；深度视频需要深度摄像头才能够获得是深度信息；3D骨架需要从RGB视频中先提前抽取出来才能进行识别；使用3D CNN进行训练以及推理都要消耗大量的资源。
[0003]现有技术公开了一种基于多尺度注意力图卷积网络的人体行为识别方法，包括步骤：获取待识别的原始3D骨架图序列；将所述原始3D骨架图序列输入经过预先训练的人体行为识别模型中，首先通过多分支输入模块从所述原始3D骨架图序列中提取关节信息、骨架信息和运动信息作为行为特征数据；然后通过多尺度注意力图卷积模块基于所述行为特征数据学习3D骨架关节点的相关性，提取各种行为在不同持续时间的时序信息；最后通过全局注意力池化层识别所述原始3D骨架图序列对应的人体行为；输出对应的人体行为识别结果。该方案通过多尺度注意力图卷积网络学习3D骨架关节点的相关性、并提取各种行为在不同...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的人体行为识别方法，其特征在于，包括以下步骤：S1：使用IMU传感器采集人体行为数据；S2：将所述人体行为数据输入经过预先训练的IMUT网络模型中；S3：输出对应的人体行为识别结果。2.根据权利要求1所述的基于深度学习的人体行为识别方法，其特征在于，步骤S2中，IMUT网络模型对输入的人体行为数据进行预测的过程包括：S21：利用特征嵌入层让输入的人体行为数据进行相邻时空特征的融合；S22：利用特征抽取层抽取出特征中的特征；S23：利用分类层通过抽取后的特征进行人体行为的识别。3.根据权利要求2所述的基于深度学习的人体行为识别方法，其特征在于，步骤S22中，特征抽取层由一个卷积核为3，填充为1，步长为1的卷积层来实现特征抽取的，具体公式为：其中，C
in
表示输入特征层数；表示输出特征层数；N
i
表示每一个批次所输入的数据数量；k表示卷积核的大小；input(N
i
，k)表示输入的张量；表示与输出特征大小一致的偏置；表示最终输出的张量。4.根据权利要求3所述的基于深度学习的人体行为识别方法，其特征在于，步骤S22中，特征抽取层由6个特征抽取block构成，每一个特征抽取block中有一个self
‑
attention和一个全连接层。5.根据权利要求4所述的基于深度学习的人体行为识别方法，其特征在于，每个特征抽取block中还包含有两个批标准化层，两个批标准化层分别位于self
‑
attention之后和全连接层之后。6.根据权利要求5所述的基于深度学习的人体行为识别方法，其特征在于，特征抽取层的构成方法具体为：Q＝W
Q
XK＝W
K
XV＝W
V
XXz＝Wa+bReLU＝max(0，V)其中，Q表示query矩阵；K表示key矩阵；V表示value矩阵；W
Q
表示query的权重矩阵；W
K
表示key的权重矩阵；W
V
表示value的权重...

【专利技术属性】
技术研发人员：尹选春，丁朋旭，
申请(专利权)人：华南农业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人