一种基于深度卷积神经网络的手势识别方法技术

技术编号:16819538 阅读:80 留言:0更新日期:2017-12-16 13:07
本发明专利技术公开了一种基于深度卷积神经网络的手势识别方法,包括:(1) 对训练集的样本图像进行边缘检测处理和样本集的划分;(2)构建深度卷积神经网络;(3)确定激活函数和损失函数;(4)训练深度神经网络;(5)根据训练后的深度卷积神经网络实现手势识别:其步骤包括:a)从待识别手势数据中提取手型图像;b)将手型图像进行边缘检测和尺寸归一化处理;c) 将归一化的手型图像输入到深度卷积神经网络中,依据输出层的输出值判定当前手势的归属类。本发明专利技术使用多重下采样技术构建深度卷积神经网络,并采用双曲正切函数作为激活函数进行神经网络的训练,不但能提高手势识别的效率,而且也能提高手势识别的准确率。

A gesture recognition method based on deep convolution neural network

The invention discloses a method of gesture recognition, depth based on convolutional neural network include: (1) of edge detection and sample set of sample images in the training set; (2) constructing convolutional neural network; (3) to determine the activation function and loss function; (4) the depth of the neural network training; (5) according to the gesture recognition to achieve deep convolutional neural network after training, which comprises the following steps: a) to extract images from the hand to hand gesture recognition data; b) will hand shape image edge detection and size normalization processing; c) input hand image normalization to convolutional neural network class, belonging to determine the current gesture according to the output value of the output layer. The invention uses multiple down sampling technology to build deep convolution neural network, and uses hyperbolic tangent function as activation function to train neural network, which not only improves the efficiency of gesture recognition, but also improves the accuracy of gesture recognition.

【技术实现步骤摘要】
一种基于深度卷积神经网络的手势识别方法
本专利技术涉及生物特征识别领域,尤其涉及一种基于深度卷积神经网络的手势识别方法。
技术介绍
生物特征识别是视频监控、安全认证等领域的关键技术之一。生物特征可以分为生理特征与行为特征。生理特征主要包括人脸、指纹和虹膜等,行为特征则包括步态、手势等。典型的基于生理特征的识别方法有指纹识别,手掌形状及轮廓识别,人脸识别,虹膜识别等。指纹识别是目前应用最广泛的基于生物特征的身份识别方法之一。指纹识别具有技术成熟,成本低廉等优点。其缺点是接触式的,具有侵犯性,存在卫生方面的问题,同时指纹也是易磨损的。人脸识别技术是近年来非常活跃的一个研究领域,具有直观性好、方便、友好、容易被人接受的优点。人脸识别是非接触式的,被动识别,不需要人的主动配合;但缺点是容易受到光照、视角、遮挡物、环境、表情等的影响,造成识别困难。虹膜特征识别的安全度和精准度非常高,但是特征采集过程非常困难。基于行为特征的身份识别技术,常见的有步态识别与手势识别。步态识别的输入是一段行走的视频图像序列,数据量很大,导致计算复杂性高,处理起来比较困难。而手势识别作为非接触式人机交互的重要组成部分,目前大多数研究者均将注意力集中在手势的最终识别方面,通常会将手势背景简化,并在单一背景下利用所研究的算法将手势进行分割,然后采用常用的识别方法将手势表达的含义通过系统分析出来。
技术实现思路
本专利技术的目的在于针对现有技术的不足,提供一种基于深度卷积神经网络的手势识别方法。本专利技术的目的是通过以下技术方案来实现的:一种基于深度神经网络的手势识别方法,包括以下步骤:(1)对训练集的样本图像进行边缘检测处理和样本集的划分:首先对训练用的手势集图像进行手型检测和边缘检测处理,并将提取的手型图像调整到统一的尺寸;将预处理后的数据划分为训练样本集和验证样本集;(2)构建深度卷积神经网络:设I和O分别为深度卷积神经网络的输入层和输出层,I和O之间的隐藏层为H1、H2、…、Hn。其中,输入层为步骤(1)获得的手型图像,输出层为一个长度为N的手势特征向量,隐藏层采用多重下采样技术,允许下采样的分块之间有重叠;(3)确定激活函数和损失函数:选择公式(1)所示的非线性双曲正切函数作为神经元的激活函数;选择公式(2)所示的损失函数。其中,n是训练集中样本的个数,x为手型图像,y为对应于x的手势特征向量,θ为参数向量;(4)训练深度神经网络:从训练样本集中选取m个训练样本,采用最速梯度下降法计算梯度;然后,采用验证样本集进行验证,当正确率超过预设阈值99.5%时,结束训练,从而得到具有确定权值w和偏置项b的深度神经网络;(5)根据训练后的深度卷积神经网络实现手势识别:其步骤包括:a)从待识别手势数据中提取手型图像;b)将手型图像进行边缘检测和尺寸归一化处理;c)将手型图像输入到深度卷积神经网络中,依据输出层的输出值判定当前手势的归属类。本专利技术的有益效果是:本专利技术的基于深度卷积神经网络的手势识别方法,使用多重下采样技术构建深度卷积神经网络,并采用双曲正切函数作为激活函数进行神经网络的训练,不但能提高手势识别的效率,而且也能提高手势识别的准确率。附图说明图1是本方法的实施流程;图2手型图像提取示意图;图3多重下采样示意图;图4双曲正切函数曲线;图5识别率比较的错误率数据。具体实施方式下面结合附图对本专利技术进行详细的描述。如图1所示,本专利技术基于深度卷积神经网络的手势识别方法分为训练阶段与识别阶段。在训练阶段,构建深度卷积神经网络,并使用训练集数据确定其权值和偏移参数的值。具体包括以下子步骤:1、从训练数据中提取手型图像:针对手势交互中的一帧,如图2(a)所示,本专利技术首先根据肤色特征提取粗略的手部区域图像,如图2(b)所示;其次,采用滤波和快速生态学膨胀、腐蚀算法对手部区域图像进行修正,得到进一步的手型图像,如图2(c)所示;2、对手型图像进行边缘检测和尺寸归一化处理:对步骤1得到的手型图像进行边缘检测和二值化处理,得到初步的手型轮廓图像,如图2(d)所示;然后,对手型轮廓曲线进行修剪和完善,并调整到统一的尺寸得到对应的手型图像;3、构建深度卷积神经网络:对于步骤2得到的手型图像,本专利技术构建了深度卷积神经网络用于手势识别。设I和O分别为深度卷积神经网络的输入层和输出层,I和O之间的隐藏层为H1、H2、…、Hn。其中,输入层为步骤2获得的手型图像,输出层为一个长度为N的手势特征向量,隐藏层采用多重下采样技术,允许下采样的分块之间有重叠,如图3所示;4、确定激活函数和损失函数:如图4所示,选择非线性双曲正切函数作为神经元的激活函数;选择公式(2)所示的平方误差函数作为损失函数。5、训练深度卷积神经网络:从训练样本集中选取m个训练样本,采用最速梯度下降法计算梯度,并根据损失函数对各隐藏层的参数进行迭代优化;然后,采用验证样本集进行验证,当正确率超过预设阈值99.5%时,结束训练,从而得到具有确定权值w和偏置项b的深度神经网络。在识别阶段,首先从待识别数据中提取手型图像,并进行边缘检测和尺寸归一化处理;然后,将其输入到训练好的深度卷积神经网络来判断当前手势的归属类。最后,将本方法与采用数据手套的方法、以及序列相似性检测(SSDA)方法进行了比较,图5给出了错误率实验数据。本文档来自技高网...
一种基于深度卷积神经网络的手势识别方法

【技术保护点】
一种基于深度卷积神经网络的手势识别方法,包括以下步骤:(1)对训练集的样本图像进行边缘检测处理和样本集的划分:首先对训练用的手势集图像进行手型检测和边缘检测处理,并将提取的手型图像调整到统一的尺寸;将预处理后的数据划分为训练样本集和验证样本集;(2)构建深度卷积神经网络:设I和O分别为深度卷积神经网络的输入层和输出层,I和O之间的隐藏层为H1、H2、…、Hn。其中,输入层为步骤(1)获得的手型图像,输出层为一个长度为N的手势特征向量,隐藏层采用多重下采样技术,允许下采样的分块之间有重叠;(3)确定激活函数和损失函数:选择公式(1)所示的非线性双曲正切函数作为神经元的激活函数;选择公式(2)所示的损失函数。其中,n是训练集中样本的个数,x为手型图像中的点,y为对应于x的输出值,θ为参数向量;

【技术特征摘要】
1.一种基于深度卷积神经网络的手势识别方法,包括以下步骤:(1)对训练集的样本图像进行边缘检测处理和样本集的划分:首先对训练用的手势集图像进行手型检测和边缘检测处理,并将提取的手型图像调整到统一的尺寸;将预处理后的数据划分为训练样本集和验证样本集;(2)构建深度卷积神经网络:设I和O分别为深度卷积神经网络的输入层和输出层,I和O之间的隐藏层为H1、H2、…、Hn。其中,输入层为步骤(1)获得的手型图像,输出层为一个长度为N的手势特征向量,隐藏层采用多重下采样技术,允许下采样的分块之间有重叠;(3)确定激活函数和损失函数:选择公式(1)所示的非线性双曲正切函数作为神经元的激活函数;选择公式(2)所示的损失函数。其中,n是训练集中样本的个数,x为手型...

【专利技术属性】
技术研发人员:王修晖
申请(专利权)人:中国计量大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1