一种基于深度卷积神经网络的手势识别方法技术

技术编号：16819538 阅读：80 留言：0更新日期：2017-12-16 13:07

本发明专利技术公开了一种基于深度卷积神经网络的手势识别方法，包括：(1) 对训练集的样本图像进行边缘检测处理和样本集的划分；（2）构建深度卷积神经网络；（3）确定激活函数和损失函数；（4）训练深度神经网络；（5）根据训练后的深度卷积神经网络实现手势识别：其步骤包括：a)从待识别手势数据中提取手型图像；b)将手型图像进行边缘检测和尺寸归一化处理；c) 将归一化的手型图像输入到深度卷积神经网络中，依据输出层的输出值判定当前手势的归属类。本发明专利技术使用多重下采样技术构建深度卷积神经网络，并采用双曲正切函数作为激活函数进行神经网络的训练，不但能提高手势识别的效率，而且也能提高手势识别的准确率。

A gesture recognition method based on deep convolution neural network

The invention discloses a method of gesture recognition, depth based on convolutional neural network include: (1) of edge detection and sample set of sample images in the training set; (2) constructing convolutional neural network; (3) to determine the activation function and loss function; (4) the depth of the neural network training; (5) according to the gesture recognition to achieve deep convolutional neural network after training, which comprises the following steps: a) to extract images from the hand to hand gesture recognition data; b) will hand shape image edge detection and size normalization processing; c) input hand image normalization to convolutional neural network class, belonging to determine the current gesture according to the output value of the output layer. The invention uses multiple down sampling technology to build deep convolution neural network, and uses hyperbolic tangent function as activation function to train neural network, which not only improves the efficiency of gesture recognition, but also improves the accuracy of gesture recognition.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度卷积神经网络的手势识别方法
本专利技术涉及生物特征识别领域，尤其涉及一种基于深度卷积神经网络的手势识别方法。
技术介绍
生物特征识别是视频监控、安全认证等领域的关键技术之一。生物特征可以分为生理特征与行为特征。生理特征主要包括人脸、指纹和虹膜等，行为特征则包括步态、手势等。典型的基于生理特征的识别方法有指纹识别，手掌形状及轮廓识别，人脸识别，虹膜识别等。指纹识别是目前应用最广泛的基于生物特征的身份识别方法之一。指纹识别具有技术成熟，成本低廉等优点。其缺点是接触式的，具有侵犯性，存在卫生方面的问题，同时指纹也是易磨损的。人脸识别技术是近年来非常活跃的一个研究领域，具有直观性好、方便、友好、容易被人接受的优点。人脸识别是非接触式的，被动识别，不需要人的主动配合；但缺点是容易受到光照、视角、遮挡物、环境、表情等的影响，造成识别困难。虹膜特征识别的安全度和精准度非常高，但是特征采集过程非常困难。基于行为特征的身份识别技术，常见的有步态识别与手势识别。步态识别的输入是一段行走的视频图像序列，数据量很大，导致计算复杂性高，处理起来比较困难。而手势识别作为非接触式人机交互的重要组成部分，目前大多数研究者均将注意力集中在手势的最终识别方面，通常会将手势背景简化，并在单一背景下利用所研究的算法将手势进行分割，然后采用常用的识别方法将手势表达的含义通过系统分析出来。
技术实现思路
本专利技术的目的在于针对现有技术的不足，提供一种基于深度卷积神经网络的手势识别方法。本专利技术的目的是通过以下技术方案来实现的：一种基于深度神经网络的手势识别方法，包括以下步骤：(1)对训练...

【技术保护点】
一种基于深度卷积神经网络的手势识别方法，包括以下步骤：(1)对训练集的样本图像进行边缘检测处理和样本集的划分：首先对训练用的手势集图像进行手型检测和边缘检测处理，并将提取的手型图像调整到统一的尺寸；将预处理后的数据划分为训练样本集和验证样本集；(2)构建深度卷积神经网络：设I和O分别为深度卷积神经网络的输入层和输出层，I和O之间的隐藏层为H1、H2、…、Hn。其中，输入层为步骤(1)获得的手型图像，输出层为一个长度为N的手势特征向量，隐藏层采用多重下采样技术，允许下采样的分块之间有重叠；(3)确定激活函数和损失函数：选择公式(1)所示的非线性双曲正切函数作为神经元的激活函数；选择公式(2)所示的损失函数。其中，n是训练集中样本的个数，x为手型图像中的点，y为对应于x的输出值，θ为参数向量；

【技术特征摘要】
1.一种基于深度卷积神经网络的手势识别方法，包括以下步骤：(1)对训练集的样本图像进行边缘检测处理和样本集的划分：首先对训练用的手势集图像进行手型检测和边缘检测处理，并将提取的手型图像调整到统一的尺寸；将预处理后的数据划分为训练样本集和验证样本集；(2)构建深度卷积神经网络：设I和O分别为深度卷积神经网络的输入层和输出层，I和O之间的隐藏层为H1、H2、…、Hn。其中，输入层为步骤(1)获得的手型图像，输出层为一个长度为N的手势特征向量，隐藏层采用多重下采样技术，允许下采样的分块之间有重叠；(3)确定激活函数和损失函数：选择公式(1)所示的非线性双曲正切函数作为神经元的激活函数；选择公式(2)所示的损失函数。其中，n是训练集中样本的个数，x为手型...

【专利技术属性】
技术研发人员：王修晖，
申请(专利权)人：中国计量大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人