一种基于深度学习的动态手势识别方法及相关设备技术

技术编号：36850890 阅读：11 留言：0更新日期：2023-03-15 17:15

本申请公开一种基于深度学习的动态手势识别方法及相关设备，属于行为动作识别技术领域。本申请通过实时获取视频流，通过手部检测模型从视频流中提取手势图像序列，将手势图像序列输入预先训练好的手势识别模型，输出手势识别结果，其中，手势识别模型包括卷积单元、预测单元和整合单元，通过卷积单元对手势图像序列进行通道分离卷积运算，得到图像卷积序列特征，通过预测单元预测手势图像序列中每一帧图像的前后相邻图像的手势特征，得到帧间手势动作特征，通过整合单元对帧间手势动作特征进行整合，输出手势识别结果。本申请提供了一套完整的动态手势触发采集、检查和识别的解决方案。案。案。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的动态手势识别方法及相关设备

[0001]本申请属于行为动作识别
，具体涉及一种基于深度学习的动态手势识别方法及相关设备。

技术介绍

[0002]手势作为一种日常沟通方式，与表情、动作和其他沟通方式相比具有直观、自然和舒适的优点，因此，手势也是除语言外最常用的交流手段，是人机交互的重要组成。手势识别技术在物联网、无人机、智能驾驶、医疗救助、虚拟现实和增强现实等领域均有广泛应用，极具价值。在自动驾驶和无人机中，智能控制系统采集手势信息并对其进行分析，根据结果发出指令，实现对车辆或无人机的导航和交互控制；在虚拟现实和增强现实中，微软的Ho l oLens已经实现了通过双手在虚拟环境中为用户提供娱乐；而在医疗救助中，手势识别可以为听障人群提供帮助，实现聋哑人与聋哑人或聋哑人与正常人之间的交流。
[0003]手势根据状态可以分为动态手势和静态手势，而根据识别对象又可以分为二维平面手型手势和三维立体手势，通过对两种手势类型的重组，可以获得手势识别的三种主要分类：二维静态手型识别、二维动态手势识别和三维动态手势识别，其中，三维动态手势因具有较好的信息表达能力而成为近年来该领域的研究热点，而二维动态手势识别因数据规模较小且采集便利，成为众多实际应用场景的首选。
[0004]目前，针对于动态手势识别，基于深度学习的手势识别方法要么聚焦于提升识别准确率，例如文章“Cont i nuous gesture segmentat i on and recogn it i on us i ng 3DCNN

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的动态手势识别方法，其特征在于，包括：响应手势识别指令，实时获取客户端上传的视频流；将所述视频流导入预先训练好的手部检测模型，通过所述手部检测模型从所述视频流中提取手势图像序列；将所述手势图像序列以张量的形式输入预先训练好的手势识别模型，输出手势识别结果，其中，所述手势识别模型包括卷积单元、预测单元和整合单元，所述卷积单元基于通道分离卷积的C3D网络训练得到，所述预测单元基于Bi
‑
LSTM网络训练得到，所述整合单元基于mobilenetV2网络训练得到；通过所述卷积单元对所述手势图像序列进行通道分离卷积运算，得到图像卷积序列特征；通过所述预测单元预测所述手势图像序列中每一帧图像的前后相邻图像的手势特征，得到帧间手势动作特征；通过所述整合单元对所述帧间手势动作特征进行整合，输出所述手势识别结果。2.如权利要求1所述的基于深度学习的动态手势识别方法，其特征在于，其中，预先训练好的所述手部检测模型基于yolov5网络进行训练得到，所述将所述视频流导入预先训练好的手部检测模型，通过所述手部检测模型从所述视频流中提取手势图像序列，具体包括：解析所述视频流，获取所述视频流中的关键帧图像；将所述关键帧图像导入预先训练好的所述手部检测模型，以识别所述关键帧图像中的手部特征图像；组合所述手部特征图像以构建所述手势图像序列。3.如权利要求2所述的基于深度学习的动态手势识别方法，其特征在于，所述组合所述手部特征图像以构建所述手势图像序列，具体包括：识别所述关键帧图像的手部特征图像，并所述手部特征图像存储到内存中；当识别到的所述手部特征图像的数量满足预设的第一数值阈值N1时，清空当前存储的所述手部特征图像，其中，所述第一数值阈值N1为正整数；持续识别剩余的手部特征图像，直至所述关键帧图像中所有的手部特征图像识别完成为止；组合当前内存中的手部特征图像以构建所述手势图像序列。4.如权利要求3所述的基于深度学习的动态手势识别方法，其特征在于，组合当前内存中的手部特征图像以构建所述手势图像序列，具体包括：计算当前内存中的手部特征图像的数量，得到手部图像数量；分别将所述手部图像数量与预设的第二数值阈值N2以及预设的第三数值阈值N3进行比对，其中，所述第二数值阈值N2和所述第三数值阈值N3均为正整数；当所述手部图像数量等于所述第二数值阈值N2时，组合当前内存中的图像以构建所述手势图像序列；当所述手部图像数量小于所述第二数值阈值N2时，向内存中添加预设的空白图像，直到当前内存中的图像数量等于所述第二数值阈值N2为止，组合当前内存中的图像以构建所述手势图像序列；当所述手部图像数量大于所述第二数值阈值N2且所述手部图像数量小于或等于所述
第三数值阈值N3时，采用预设的第一筛选规则对当前内存中的图像进行筛选，并组合筛选后的图像以构建所述手势图像序列；当所述手部图像数量大于所述第三数值阈值N3时，采用预设的第二筛选规则对当前内存中的图像进行筛选，并组合筛选后的图像以构建所述手势图像序列。5.如...

【专利技术属性】
技术研发人员：王瑞平，吴士泓，吴勇涛，王志刚，
申请(专利权)人：远光软件股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人