一种基于3D卷积神经网络算法的动态手势识别方法技术

技术编号：21478753 阅读：29 留言：0更新日期：2019-06-29 05:03

首次提出了一种基于3D卷积神经网络的算法进行动态手势识别。基于3D卷积神经网络的动态手势别与传统动态手势识别方法相比，不需要人为提取手势特征，通过3D卷积神经网络，自动提取手势特征；3D卷积神经网络与常见的2D卷积神经网络最大的不同在于3D卷积神经网络采用3D卷积核和3D池化窗口，这样卷积神经网络进行卷积操作不仅可以提取空间特征，而且可以提取时间特征；此发明专利技术能够利用卷积层自动学习手势特征，克服了人工提取特征的弊端以及常见卷积神经网络提取特征不够精细全面及稳定性欠佳等缺点，相比之下识别精度更高，训练时间相当；且此方法灵活性强，适用性广。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于3D卷积神经网络算法的动态手势识别方法
本专利技术属于运用深度学习进行图像处理的
，涉及本文提出了一种基于3D卷积神经网络的算法进行动态手势识别。
技术介绍
随着计算机技术、通讯技术、硬件设备等的飞速发展，人机交互已经在生活中越来越频繁，人类非语言沟通(手势，身体姿势和面部表情的沟通)占人类所有沟通的三分之二。并且手势具有自然、直观、易学等优点，成为了研究的热点。将手势识别应用人机交互如：智能电视的操控，车载多媒体交互等上时，都需要用到动态手势识别。与静态手势相比，动态手势的识别需要同时结合时间信息和空间信息，这使得动态手势识别难度更大。动态手势识别的过程本质上讲就是识别手在空间中的运动信息。传统的动态手势识别方法依赖于手势特征的选取，大部分动态手势识别是利用手在空间中的运动轨迹作为特征来实现动态手势的识别。下面我们将分析常用的几种传统动态手势识别方法的优劣。隐马尔科夫模型是一种统计模型，创立于20世纪，并在语音识别领域、模式识别领域取得了许多重要的成果。基于隐马尔科夫模型的动态手势识别方法是把手形及运动轨迹作为手势识别的特征进行识别。通过对人手轮廓的跟踪，获得手部形状和多自由度(手心空间坐标(x,y,z)以及欧式位姿(alpha，beta，theta))的手势的运动轨迹，这样就实现了对视频中手势特征的提取。将提取的动态手势特征作为隐马尔科夫模型的观察值序列，并作为训练好的隐马尔科夫模型的输入值，通过前向算法求出最大似然值，然后输出识别的手势。基于隐马尔科夫模型的动态手势识别将每一种手势对应一个隐马尔科夫模型，其优点是对复杂的手势动作识别精度...

【技术保护点】
1.一种基于3D卷积神经网络的算法进行动态手势识别方法，其特征在于，包括：利用卷积层自动学习手势特征，克服了人工提取特征的弊端的同时又更加准确的表示了图像。

【技术特征摘要】
1.一种基于3D卷积神经网络的算法进行动态手势识别方法，其特征在于，包括：利用卷积层自动学习手势特征，克服了人工提取特征的弊端的同时又更加准确的表示了图像。2.根据权利要求1所述的方法，其特征在于，所述动态手势识别方法的方案步骤包括：1)对于动态手势数据进行采集与预处理，数据分为训练数据与测试数据；2)在获得了数据之后进行实验测试环境的搭建，分为硬件与软件的搭建；3)其次进行基于3D卷积神经网络的设计，即：确定神经网络层数，选择合适的尺度特征，避免过拟合；4)然后把经过标记的训练数据放入此网络结构中进行学习；5)最后输入测试数据样本进行测试；6)得出最后的动态手势识别精度。3.根据权利要求2所述的方法，其特征在于，所述手势样本采集包括：采用VIVA动态手势数据集并进行了扩充；该手势集定义了19个手势。4.根据权利要求2所述的方法，其特征在于，所述图像预处理包括：数据预处理，在VIVA手势数据集中，不同的手势视频有不同的长度，本发明输入采用的是32帧长度的视频，需要对数据进行预处理，使得数据长度符合神经网络的输入要求；通过使用最近邻域法丢弃或重复帧使得每个手势的视频长度都为32帧。5.根据权利要求2所述的方法，其特征在于，所述测试实验环境的搭建包括：硬件环境是采用Nvidia的GTX1060显卡和Intel的6代i7处理器，软件环境采用的Ubuntu16.04系统和伯克利视觉和学习中心(BVLC)开发的Caffe框架；Caffe框架具有灵活的框架结构与良好的性能。6.根据权利要求2所述的方法，其特征在于，所述3D卷积神经网络的设计包括：1)基于卷积层：卷积神经网络与普通神经网络最大的不同在于卷积神...

【专利技术属性】
技术研发人员：谢斌，宋迪，喻仲斌，
申请(专利权)人：中南大学，
类型：发明
国别省市：湖南,43

全部详细技术资料下载我是这个专利的主人