一种基于动态手势识别的智能人机交互方法技术

技术编号：20362226 阅读：21 留言：0更新日期：2019-02-16 16:14

本发明专利技术公开了一种基于动态手势识别的智能人机交互方法，属于人机交互技术领域。本发明专利技术针对目前基于手势的人机交互方案一般采用传统的机器学习算法，无法满足智慧家庭背景下嵌入式设备对实时性、鲁棒性的要求。本发明专利技术通过改进轻量化的目标检测网络，实现对手部区域的快速准确检测，在此基础上集成目标跟踪算法获取手部的运动轨迹并根据轨迹分类结果提供个性化的人机交互行为。本发明专利技术能够在嵌入式设备上实现对动态手势的实时识别，并对光照、肤色、背景等因素有极强的鲁棒性，是一种面向智慧家庭场景的智能人机交互解决方案。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于动态手势识别的智能人机交互方法
本专利技术提出了一种基于动态手势识别的非接触式交互方法，是一种面向智慧家庭场景的智能人机交互解决方案。
技术介绍
近年来，随着机器学习技术，特别是深度学习理论的飞速发展，以及高清摄像头、高性能显卡等硬件设备制造工艺的日益成熟，人工智能技术从主要被应用于工业界，开始被越来越广泛地应用于人们的日常生活中，例如，基于车牌识别的智能门禁系统、基于人脸识别的无人值守超市、基于风格迁移的人脸卡通化软件等。在此背景下，旨在综合人工智能、物联网、云计算以创造出舒适、健康、安全、便捷的定制化家居生活的“智慧家庭”概念应运而生，其中，如何结合家庭环境感知对家居设备进行控制，即设计出一种面向智慧家庭场景的智能人机交互解决方案，是一项极具挑战性的工作。目前，市面上已经有一批基于手势识别的人机交互方案及设备，但是，该类方案一般只能识别静态手势，且多需要特殊的设备，应用场景较为有限。以微软XboxOne主机的手势操作为例，其手势交互方案不仅需要配备专用的Kinect深度摄像头，且基本只能识别肢体动作，对手势的识别率较低，无法满足用户日常所需。另一方面，囿于家居场景中嵌入式设备的算力限制，现有方案无法使用残差网络等目前业界性能最好的卷积神经网络，而只能采用传统机器学习算法中的支持向量机甚至简单的模板匹配方法来进行静态手势识别，此类方法一方面识别效果较差，特别是对光照、肤色、手势方向、图像背景等因素的鲁棒性较差；另一方面，该类方法不易集成手部区域跟踪及轨迹分类算法，无法实现对动态手势即手势运动轨迹作出交互响应行为，基本不能满足智能化家庭背景下的人机...

【技术保护点】
1.一种基于动态手势识别的智能人机交互方法，其特征在于，包括下列步骤：步骤一、对彩色摄像头捕获的视频帧进行手部区域检测：通过卷积神经网络提取视频图像的低阶特征谱和高阶特征谱，并将低阶特征谱经池化操作后归一化为预设大小；将高阶特征谱经反卷积操作后也归一化为预设大小，归一化后的低阶特征谱与高阶特征谱的尺寸相同，然后对两者进行特征谱融合，得到融合特征谱；基于融合特征谱进行手部区域检测，得到初步目标检测框，并对其进行非极大值抑制操作以去除冗余检测框；具体抑制处理为：(1)将所有检测目标框根据分类置信度按从大到小的顺序排序；(2)选取置信度最高分所对应的检测框，记为框A并保留；(3)遍历所有非A框，去除其中与框A的交并比大于预设阈值的检测目标框；(4)对未处理的检测目标框重复步骤(2)～(3)，直到所有检测目标框均被处理，所述处理包括保留和删除；步骤二、对手部区域进行基于相关滤波的手势跟踪：步骤三、对手势轨迹进行分类：通过预设的分类网络，每隔固定帧数进行一次手势轨迹分类处理，且在将轨迹样本送入分类网络前，进行白边补全及大小归一化操作；步骤四：根据手势轨迹作出交互行为。

【技术特征摘要】
1.一种基于动态手势识别的智能人机交互方法，其特征在于，包括下列步骤：步骤一、对彩色摄像头捕获的视频帧进行手部区域检测：通过卷积神经网络提取视频图像的低阶特征谱和高阶特征谱，并将低阶特征谱经池化操作后归一化为预设大小；将高阶特征谱经反卷积操作后也归一化为预设大小，归一化后的低阶特征谱与高阶特征谱的尺寸相同，然后对两者进行特征谱融合，得到融合特征谱；基于融合特征谱进行手部区域检测，得到初步目标检测框，并对其进行非极大值抑制操作以去除冗余检测框；具体抑制处理为：(1)将所有检测目标框根据分类置信度按从大到小的顺序排序；(2)选取置信度最高分所对应的检测框，记为框A并保留；(...

【专利技术属性】
技术研发人员：李宏亮，尹康，袁欢，梁小娟，邓志康，颜海强，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人