一种动态手势识别方法及系统技术方案

技术编号：19964949 阅读：29 留言：0更新日期：2019-01-03 13:11

本发明专利技术公开了一种动态手势识别方法，所述方法包括：采用3D摄像头对手势进行拍摄，获取一组具有n帧图像的手部动作视频；分别识别每一帧图像中的m个手部特征点，获取每一个手部特征点在对应图像帧中的空间坐标信息，得到一帧图像中的手部特征二维向量m*3；将每一帧图像中的手部特征二维向量集合，形成一个三维向量集n*m*3；重复执行步骤S1‑S3，获取多个三维向量集；将所述获取的多个所述三维向量集作为训练样本，对所述训练样本标记一手势名称，并对所述训练样本进行模型训练，得到所述手势名称对应的模型参数，能够高精度地进行动态手势识别。

A Dynamic Gesture Recognition Method and System

The invention discloses a dynamic gesture recognition method, which includes: taking gestures with a 3D camera to obtain a set of hand motion videos with N frame images; identifying m hand feature points in each frame image, obtaining spatial coordinate information of each hand feature point in the corresponding image frame, and obtaining a two-dimensional vector m*3 of hand feature in one frame image; A set of two-dimensional vectors of hand features in each frame image is formed into a set of three-dimensional vectors n*m*3; multiple sets of three-dimensional vectors are obtained by repeated execution of Number, can be high-precision dynamic gesture recognition.

全部详细技术资料下载

【技术实现步骤摘要】
一种动态手势识别方法及系统
本专利技术属于通信与信息领域的识别
，特别涉及一种动态手势识别方法及系统。
技术介绍
当下，随着人工智能技术的迅猛发展，对于多种人机交互或者增强现实的任务来说，手势逐渐成为设备输入的重要来源之一，所以，准确的手势估计显得越来越重要，并且在计算机视觉领域吸引了越来越多的注意力。硬件方面，随着摄像头以及显示硬件水平的发展，手势的表征从起初的2D空间慢慢的发展到3D空间，形状的空间描述性大大增强，也越来越逼近于人类的真实感官理解。软件方面，随着深度学习的发展进步，各种CNN（深度卷积网络）、RNN(循环卷积网络)模型被应用于手势识别领域，他们能够从高层次抽象出手势的基本特征，然后利用这些特征进行手势的学习，最终达到识别的效果。对于手势而言，通用的认知理论认为，手指的每个关节以及手腕的相互组合在三维空间构成的不同的位移组合形成了我们所谓的动态手势，正是由于手上的关节点众多，每个关节又有很大的活动自由度，再加上手势本身有一定的自相似性，自遮挡等问题，所以，手势识别还是有很大的挑战性。在静态手势识别方面，目前有研究者通过2D/3D摄像头获取单张静态手势图像，然后搜索定位手部区域，通过CNN卷积预训练的模型找到手指指尖位置Pi与掌心位置Pc，计算Pi–Pc的值，其中i从1到5，分别表示5个手指指尖，利用得到的距离值与适当的阈值界定进行手势的识别。该技术方案的缺点是只能处理静态的手势，不能处理动态手势，应用范围比较窄，达不到动态组合的表征效果；仅仅使用指尖的位置，忽略了手指其他关节点的位置信息，模型所能表达的手势种类很局限。动态手势识别方...

【技术保护点】
1.一种动态手势识别方法，其特征在于，所述方法包括：S1、采用3D摄像头对手势进行拍摄，获取一组具有n帧图像的手部动作视频；S2、分别识别每一帧图像中的m个手部特征点，获取每一个手部特征点在对应图像帧中的空间坐标信息，得到一帧图像中的手部特征二维向量m*3；S3、将每一帧图像中的手部特征二维向量集合，形成一个三维向量集n*m*3；S4、重复执行步骤S1‑S3，获取多个三维向量集；S5、将所述获取的多个所述三维向量集作为训练样本，对所述训练样本标记一手势名称，并对所述训练样本进行模型训练，得到所述手势名称对应的模型参数。

【技术特征摘要】
1.一种动态手势识别方法，其特征在于，所述方法包括：S1、采用3D摄像头对手势进行拍摄，获取一组具有n帧图像的手部动作视频；S2、分别识别每一帧图像中的m个手部特征点，获取每一个手部特征点在对应图像帧中的空间坐标信息，得到一帧图像中的手部特征二维向量m*3；S3、将每一帧图像中的手部特征二维向量集合，形成一个三维向量集n*m*3；S4、重复执行步骤S1-S3，获取多个三维向量集；S5、将所述获取的多个所述三维向量集作为训练样本，对所述训练样本标记一手势名称，并对所述训练样本进行模型训练，得到所述手势名称对应的模型参数。2.如权利要求1所述的动态手势识别方法，其特征在于，所述方法还包括：所述手部特征点是手部关节点；所述m是21。3.如权利要求2所述的动态手势识别方法，其特征在于，所述21个手部关节点包括大拇指的指尖、第一关节、第二关节和第三关节，食指的指尖、第一关节、第二关节和第三关节，中指的指尖、第一关节、第二关节和第三关节，无名指的指尖、第一关节、第二关节和第三关节，小拇指的指尖、第一关节、第二关节和第三关节，以及手腕中心。4.如权利要求3所述的动态手势识别方法，其特征在于，所述步骤S2包括：根据卷积网络模型，对每一帧图像进行卷积和特征提取；对每一帧图像中的21个手部关节点进行定位，获取每一个手部关节点在对应图像帧中的空间坐标信息；得到一帧图像中的手部特征二维向量21*3，其中，21指21个手部关节点，3指每一个手部关节点的空间坐标信息。5.如权利要求4所述的动态手势识别方法，其特征在于，所述步骤S3包括：将所述每一帧图像对应的二维向量21*3进行堆叠，形成一个三维向量集n*21*3，其中，n为所述手部动作视频中图像帧的个数。6.如权利要求5所述的动态手势识别方法，其特征在于，所述步骤S5包括：将所述获取的多个所述三维向量集n*21*3作为训练样本；对所述训练样本标记一手势名称；对所述训练样本进行长短记忆网络模型训练...

【专利技术属性】
技术研发人员：管泽鑫，
申请(专利权)人：上海斐讯数据通信技术有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人