System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于动作识别的方法、装置、系统和计算机可读介质制造方法及图纸_技高网

用于动作识别的方法、装置、系统和计算机可读介质制造方法及图纸

技术编号:40503568 阅读:8 留言:0更新日期:2024-03-01 13:17
本申请公开了用于动作识别的方法、装置、系统和计算机可读介质。一种用于动作识别的方法,包括:接收训练数据,训练数据包括与多个红外接收器对应的第一红外信号和与第一红外信号对应的动作识别结果;构建动作识别模型,动作识别模型包括数据预处理模块、卷积模块、门控循环单元(GRU)模块、注意力机制模块和分类模块;以及利用训练数据对动作识别模型进行训练以得到经训练的动作识别模型。

【技术实现步骤摘要】

本专利技术涉及使用主动红外传感器阵列进行动作识别,尤其涉及用于动作识别的方法、装置、系统和介质。


技术介绍

1、动作识别,包括手势识别、头部运动识别、身体姿势识别等,是人机交互的一个重要研究方向,目前主要有以下几种方法:基于视觉的方法,通过使用摄像头来捕获动作的图像或视频,然后通过图像处理和机器学习算法来识别动作,缺点是对环境照明条件敏感、计算量大;基于传感器的方法,通过使用手套、头戴式设备等设备上的加速度计、陀螺仪等传感器来捕获运动数据,然后分析识别动作,缺点是需要佩戴额外的设备;基于雷达的方法,使用毫米波雷达捕获身体部位在空中的点云信息,通过分析运动特征来识别动作,缺点是识别精度较低。另一方面,现有基于深度学习的算法存在参数多、计算量大等缺点,无法部署在资源受限的端点设备上,例如mcu等等环境下,进而限制了动作识别方案的落地应用。


技术实现思路

1、应当理解,本专利技术以上的一般性描述和以下的详细描述都是示例性和说明性的,并且旨在为如权利要求所述的本专利技术提供进一步的解释。

2、根据本专利技术一方面,提供了一种用于动作识别的方法,包括:接收训练数据,训练数据包括与多个红外接收器对应的第一红外信号和与第一红外信号对应的动作识别结果;构建动作识别模型,动作识别模型包括数据预处理模块、卷积模块、门控循环单元(gru)模块、注意力机制模块和分类模块,其中,数据预处理模块用于将动作识别模型的输入数据分割为多个数据块,多个数据块中的每个数据块包括由多个红外接收器连续k次采集的红外信号;其中,对于多个数据块中的每个数据块:卷积模块用于对当前数据块进行空间特征提取以得到当前卷积模块输出;注意力机制模块用于对当前卷积模块输出和前一gru模块输出进行上下文信息提取以得到当前空间注意力特征;gru模块用于对当前空间注意力特征和前一gru模块输出进行特征扫描以得到当前gru模块输出;以及其中,分类模块用于对针对多个数据块中的最后一个数据块的当前gru模块输出执行动作分类以得到动作识别结果;以及利用训练数据对动作识别模型进行训练以得到经训练的动作识别模型。

3、在上述的方法中,卷积模块对当前数据块进行空间特征提取包括对当前数据块执行以下操作:使用第一卷积核对当前数据块进行单通道特征提取以得到第一特征;使用第二卷积核对当前数据块进行通道间特征提取以得到第二特征;对第一特征与第二特征进行叠加并应用第一非线性激活函数以得到第三特征;对第三特征应用点卷积层、第二非线性激活函数和深度卷积层以得到第四特征;对当前数据块应用池化层以得到第五特征;将第四特征与第五特征叠加以得到第六特征;以及对第六特征应用mb3模块并与第五特征叠加、应用批归一化层和第三非线性激活函数以得到当前卷积模块输出。

4、在上述的方法中,第一卷积核包括5×1、7×1、9×1、11×1、13×1卷积核中的一个或多个,第二卷积核为3×3卷积核。

5、在上述的方法中,第一非线性激活函数、第二非线性激活函数、和第三非线性激活函数是relu、relu6、sigmoid函数中的任一者。

6、在上述的方法中,mb3模块的数量为3个。

7、在上述的方法中,分类模块执行动作分类包括应用全局平均池化层或全连接层。

8、在上述的方法中,进一步包括:接收由多个红外接收器采集的第二红外信号;以及将第二红外信号输入至经训练的动作识别模型作为输入数据以得到动作识别结果。

9、根据本专利技术另一方面,提供了一种用于动作识别的装置,包括:存储设备,用于存储与多个红外接收器对应的红外信号;以及计算设备,用于执行如上述方法中任一项的方法。

10、根据本专利技术又一方面,提供了一种用于动作识别的系统,包括:红外发射器,用于发射红外信号;多个红外接收器,用于采集红外信号;存储设备,用于存储多个红外接收器采集的红外信号;以及计算设备,用于执行如上述方法中任一项的方法。

11、根据本专利技术再一方面,提供了一种计算机可读介质,在其上存储计算机程序指令,计算机程序指令在被执行时使计算机执行如上述方法中任一项的方法。

本文档来自技高网...

【技术保护点】

1.一种用于动作识别的方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述卷积模块对当前数据块进行空间特征提取包括对当前数据块执行以下操作:

3.如权利要求2所述的方法,其特征在于,所述第一卷积核包括5×1、7×1、9×1、11×1、13×1卷积核中的一个或多个,所述第二卷积核为3×3卷积核。

4.如权利要求2所述的方法,其特征在于,所述第一非线性激活函数、所述第二非线性激活函数、和所述第三非线性激活函数是RELU、RELU6、Sigmoid函数中的任一者。

5.如权利要求2所述的方法,其特征在于,所述MB3模块的数量为3个。

6.如权利要求1中任一项所述的方法,其特征在于,所述分类模块执行动作分类包括应用全局平均池化层或全连接层。

7.如权利要求1-6中任一项所述的方法,其特征在于,进一步包括:

8.一种用于动作识别的装置,包括:

9.一种用于动作识别的系统,包括:

10.一种计算机可读介质,在其上存储计算机程序指令,所述计算机程序指令在被执行时使计算机执行如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种用于动作识别的方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述卷积模块对当前数据块进行空间特征提取包括对当前数据块执行以下操作:

3.如权利要求2所述的方法,其特征在于,所述第一卷积核包括5×1、7×1、9×1、11×1、13×1卷积核中的一个或多个,所述第二卷积核为3×3卷积核。

4.如权利要求2所述的方法,其特征在于,所述第一非线性激活函数、所述第二非线性激活函数、和所述第三非线性激活函数是relu、relu6、sigmoid函数中的任一者。<...

【专利技术属性】
技术研发人员:徐继伟江锦标周培锋傅品慧刘茂林
申请(专利权)人:广东沐光智能照明有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1