一种复杂干扰场景下的手势识别系统技术方案

技术编号：39138387 阅读：10 留言：0更新日期：2023-10-23 14:53

本公开是关于一种复杂干扰场景下的手势识别系统。该复杂干扰场景下的手势识别系统包括：手掌检测模块、关键点预测模块、手势分类模块，其中：所述手掌检测模块用于接收视频流输入信号，基于所述视频流输入信号生成手掌检测框，并将所述手掌检测框发送至关键点预测模块；所述关键点预测模块用于接收的手掌检测框，基于所述手掌检测框生成手部关键点坐标，并将所述手部关键点坐标发送至手势分类模块；所述手势分类模块用于接收手部关键点坐标，基于预设交互手势对所述手部关键点坐标进行手势识别。本公开解决了手势交互过程中手势识别准确率不高的问题，提升了人机交互中通过手势识别实现指令下发的准确性及安全性。识别实现指令下发的准确性及安全性。识别实现指令下发的准确性及安全性。

全部详细技术资料下载

【技术实现步骤摘要】
一种复杂干扰场景下的手势识别系统

[0001]本公开涉及视觉识别领域，具体而言，涉及一种复杂干扰场景下的手势识别系统。

技术介绍

[0002]人机交互在当代生活、工业以及军事活动中扮演着越来越重要的角色，而手势作为最自然的肢体语言之一，使得手势识别成为人机交互领域中的关键技术。然而，手势的旋转、尺寸的变化、光照条件以及背景的复杂性都会给手势识别带来很大的挑战。手势的未被识别及误识别将会导致向下发送错误指令，可能会造成在某些领域(如无人驾驶的车辆控制，战场指挥)造成严重危害。
[0003]现有技术中，一种基于机器视觉的实时手势识别方法及手势识别系统根据人体和手部的特点设计了神经网络结构，同时在手部关节点识别实现手势识别环节中，设计了一种手势训练数据生成方式并通过迁移学习实现了手势识别，够达到实时的手势和手部关节识别。该专利技术没有考虑环境光照、手部遮挡、环境背景复杂等外部场景约束的情况。基于MediaPipe手势识别模型的安卓人机交互方法利用手机前置摄像头采集手势信息以进行人机交互，实现一种基于MediaPipe手势识别模型的安卓人机交互方法。该专利技术仅仅是将MediaPipe的输出结果传递给一个多层感知机网络进行手势分类，而没有考虑强震动及其他手势干扰场景下对手势识别的影响。
[0004]因此，需要一种或多种方法解决上述问题。
[0005]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
专利技术内...

【技术保护点】

【技术特征摘要】
1.一种复杂干扰场景下的手势识别系统，其特征在于，所述系统包括手掌检测模块、关键点预测模块、手势分类模块，其中：所述手掌检测模块包括第一阻塞器、手掌检测模型、第一矩形框转换模块，所述手掌检测模块用于接收视频流输入信号，基于所述视频流输入信号生成手掌检测框，并将所述手掌检测框发送至关键点预测模块；所述关键点预测模块包括图片裁剪模块、关键点预设模型、第二矩形框转换模块、滤波器，所述关键点预测模块用于接收所述手掌检测模块发送的手掌检测框，基于所述手掌检测框生成手部关键点坐标，并将所述手部关键点坐标发送至手势分类模块；所述手势分类模块包括第二阻塞器、手势识别网络，所述手势分类模块用于接收所述关键点预测模块发送的手部关键点坐标，基于预设交互手势对所述手部关键点坐标进行手势识别。2.如权利要求1所述的系统，其特征在于，所述系统的第一阻塞器用于接收视频流输入信号，并将所述视频流输入信号的第一帧发送至手掌检测模型。3.如权利要求2所述的系统，其特征在于，所述系统的第一阻塞器还用于接收视频流输入信号及所述关键点预测模块的关键点预设模型发送手部存在置信度，基于所述手部存在置信度进行判定；基于判定结果，将所述视频流输入信号的当前帧发送至手掌检测模型。4.如权利要求3所述的系统，其特征在于，所述系统的手掌检测模型用于基于预设编解码特征提取器在所述第一阻塞器发送的所述视频流输入信号的第一帧...

【专利技术属性】
技术研发人员：陈籽妍，李钰新，姬永超，张秋磊，杨嘉业，姚超，李博伦，王强，
申请(专利权)人：北京机械设备研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人