基于卷积神经网络的汉语手语识别方法技术

技术编号：17363974 阅读：47 留言：0更新日期：2018-02-28 14:16

本发明专利技术涉及一种基于卷积神经网络的汉语手语识别方法，包括下列步骤：采集汉语手语的各类手势图，经手势分割和预处理获得多张手势样本；将采集到的手势样本数据集按5:1:1的比例分为训练集、验证集和测试集；搭建7层的卷积神经网络CNN模型，包含3层卷积层、2层池化层和1层全连接层，用该CNN模型训练集的手势特征，取每次批处理batchsize的图像数为200，通过最大池化选取每次卷积后的特征；在最后一次卷积层之后，通过Softmax函数进行特征向量的分类，分类结果与标签对比并更新模型的权值；对比每次迭代后验证集的准确率，与上一次的验证结果对比，若准确率下降则继续迭代，否则停止迭代。

Chinese sign language recognition method based on convolution neural network

The invention relates to a sign language recognition method based on convolutional neural network, which comprises the following steps: collecting all kinds of Chinese sign language gestures, the gesture segmentation and preprocessing to obtain a sample gesture; gesture data set according to the ratio of 5:1:1 validation set and test set for the training set, set up 7; the convolutional neural network CNN model, contains 3 layers, 2 layers layer volume pool layer and the 1 layer fully connected with the CNN layer, hand feature model of training set, and each batch of batchsize image number is 200, by the largest pool of selected features for each volume product after; after the last time roll layer classification feature vector by Softmax function, and the classification results and the comparison of label update model weights; validation accuracy set in each iteration after comparison, compared with previous results, if the quasi The rate drop continues to iterate, otherwise the iteration will stop.

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积神经网络的汉语手语识别方法
本专利技术属于手势识别领域。
技术介绍
目前手势识别方法主要分为两类，一是基于穿戴式设备的是被方法，虽然实时性较好，但是穿戴设备有价格昂贵，使用不太便利的缺点；另一类就是基于视觉系统的，这类方法通过传感器采集图像信息，然后进行图像的处理和识别过程，给使用者带来了很好的人机交互性，如何提高识别精度和减少识别时间是这类方法一直以来的难点。近年来，随着计算机图形计算处理能力的显著提高，深度学习在语音识别、图像分类等领域取得了重大突破。深度学习利用多层非线性的深度神经网络对输入的图像或语音信息进行分类处理，能有效的自主提取特征，识别精度高。手语识别作为人机交互的重要组成，对听力障碍人群与计算机或者不懂手语人之间的交流有重要作用。
技术实现思路
本专利技术的目的是提供一种识别精度高的汉语手语识别方法。本专利技术通过卷积神经网络训练汉语手语模型，对汉语手语的实时识别。技术方案如下:一种基于卷积神经网络的汉语手语识别方法，包括下列步骤：步骤1，采集汉语手语的各类手势图，经手势分割和预处理获得多张手势样本。步骤2，将采集到的手势样本数据集按5:1:1的比例分为训练集、验证集和测试集；步骤3，搭建7层的卷积神经网络CNN模型，包含3层卷积层、2层池化层和1层全连接层，用该CNN模型训练集的手势特征，取每次批处理batchsize的图像数为200，通过最大池化选取每次卷积后的特征；步骤4，在最后一次卷积层之后，通过Softmax函数进行特征向量的分类，分类结果与标签对比并更新模型的权值；步骤5，对比每次迭代后验证集的准确率，与上一次的验证结果对...
基于卷积神经网络的汉语手语识别方法

【技术保护点】
一种基于卷积神经网络的汉语手语识别方法，包括下列步骤：步骤1，采集汉语手语的各类手势图，经手势分割和预处理获得多张手势样本。步骤2，将采集到的手势样本数据集按5:1:1的比例分为训练集、验证集和测试集；步骤3，搭建7层的卷积神经网络CNN模型，包含3层卷积层、2层池化层和1层全连接层，用该CNN模型训练集的手势特征，取每次批处理batchsize的图像数为200，通过最大池化选取每次卷积后的特征；步骤4，在最后一次卷积层之后，通过Softmax函数进行特征向量的分类，分类结果与标签对比并更新模型的权值；步骤5，对比每次迭代后验证集的准确率，与上一次的验证结果对比，若准确率下降则继续迭代，否则停止迭代。

【技术特征摘要】
1.一种基于卷积神经网络的汉语手语识别方法，包括下列步骤：步骤1，采集汉语手语的各类手势图，经手势分割和预处理获得多张手势样本。步骤2，将采集到的手势样本数据集按5:1:1的比例分为训练集、验证集和测试集；步骤3，搭建7层的卷积神经网络CNN模型，包含3层卷积层、2层池化层和1层全连接层，用该CNN模型训...

【专利技术属性】
技术研发人员：吕辰刚，鲍志强，
申请(专利权)人：天津大学，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人