一种三维手势识别方法及装置制造方法及图纸

技术编号：23432010 阅读：57 留言：0更新日期：2020-02-25 13:14

本发明专利技术公开了一种三维手势识别方法及装置，该方法包括：(1)采集静态手势，并根据建立的手部空间坐标系进行手部位置表示；(2)以静态手势的骨节方向信息作为手势识别的观测值特征序列，并对不同角度和位置下的静态手势对应的手势识别观测值特征序列预处理；(3)采用GMM‑HMM模型对静态手势对应的观测序列进行识别；(4)根据等待模型对动态手势进行识别；(5)在用户使用时收集用户个体的手势数据，并利用该数据对GMM‑HMM模型进行迁移训练，形成针对于每个用户的模型。本发明专利技术所述的归一化的方法是在特征序列的基础上来的，它能够在保留完整数据的情况下很方便且准确的实现归一化，使得识别准确率升高。

A 3D gesture recognition method and device

全部详细技术资料下载

【技术实现步骤摘要】
一种三维手势识别方法及装置
本专利技术涉及手势识别技术，具体涉及一种三维手势识别方法及装置。
技术介绍
随着虚拟现实及增强现实的发展，新的三维界面形式登上历史舞台，手势交互由于其比面部表情和眼动更易于捕捉和识别，又比全身姿势更易于实施(特别是在狭小空间中)的特点成为了更适用于虚拟环境自然用户界面的交互方式。此外在智能产品、汽车、家居等领域，手势交互的作用也逐渐凸显出来。目前尚没有成熟且具备高度可扩展性的手势交互应用开发工具，而由于手势识别所需的机器学习等专业知识成为了很多开发人员无法逾越的技术壁垒，这就导致了手势交互应用乃至于手势交互发展的滞后。由于不同人的手掌的尺寸有着相当大的差异，基于坐标点数据的特征序列仍存在着一定的不足，这是由于基于点坐标的归一化方法无法有效的对数据进行归一化处理，这就导致了识别结果的不稳定。动态识别相较于静态识别而言增加了时间变量这一维度，即观测数据包含多个时间节点的手势观测序列信息，由于带有时间的数据序列不符合GMM-HMM模型的输入数据要求，因而必须要对数据序列进行降维。在现有的识别算法之中，研究者多采用将三维位置信息换算为手指间的夹角、不同指尖的距离、某部位的位移等低维度数据方式来对数据进行降维，并将每个时间点下的一维参数作为手势识别观测序列值的单个数据节点。虽然上述方法实现了数据的降维，但对于动态手势识别来说仍然存在着一定的问题：首先上述的降维方式对原始数据进行了二次处理，这势必会导致部分数据的丢失而影响识别结果。其次，由于不同用户做手势的速度...

【技术保护点】
1.一种三维手势识别方法，其特征在于，包括以下步骤：/n(1)采集静态手势，并根据建立的手部空间坐标系进行手部位置表示；/n(2)以静态手势的骨节方向信息作为手势识别的观测值特征序列，并对不同角度和位置下的静态手势对应的手势识别观测值特征序列进行空间旋转坐标上的归一化，得到各个静态手势对应的观测序列；/n(3)确定隐马尔可夫模型的隐含状态数和混合高斯模型的分模型数后，采用GMM-HMM模型对静态手势对应的观测序列进行识别；/n(4)根据等待模型对动态手势进行识别；/n(5)在用户使用时收集用户个体的手势数据，并利用该数据对所述GMM-HMM模型进行迁移训练，形成针对于每个用户的模型。/n

【技术特征摘要】
1.一种三维手势识别方法，其特征在于，包括以下步骤：
(1)采集静态手势，并根据建立的手部空间坐标系进行手部位置表示；
(2)以静态手势的骨节方向信息作为手势识别的观测值特征序列，并对不同角度和位置下的静态手势对应的手势识别观测值特征序列进行空间旋转坐标上的归一化，得到各个静态手势对应的观测序列；
(3)确定隐马尔可夫模型的隐含状态数和混合高斯模型的分模型数后，采用GMM-HMM模型对静态手势对应的观测序列进行识别；
(4)根据等待模型对动态手势进行识别；
(5)在用户使用时收集用户个体的手势数据，并利用该数据对所述GMM-HMM模型进行迁移训练，形成针对于每个用户的模型。

2.根据权利要求1所述的三维手势识别方法，其特征在于，所述步骤(1)中，手部空间坐标系以手掌掌心方向向量为X轴、手指指向向量为Y轴以及同时与二者垂直的方向向量为Z轴，所在的直线为坐标轴。

3.根据权利要求1所述的三维手势识别方法，其特征在于，所述步骤(2)中，手势识别的观测值特征序列为拇指三个骨节从掌心到手指的方向向量、食指除去最靠近掌心一段骨节的三个骨节从掌心到手指的方向向量、中指除去最靠近掌心一段骨节的三个骨节从掌心到手指的方向向量、无名指除去最靠近掌心一段骨节的三个骨节从掌心到手指的方向向量和小指除去最靠近掌心一段骨节的三个骨节从掌心到手指的方向向量，共15个方向向量。

4.根据权利要求1所述的三维手势识别方法，其特征在于，所述步骤(2)中，对不同角度和位置下的静态手势对应的手势识别观测值特征序列进行空间旋转坐标上的归一化，具体包括：
以建立的所述空间直角坐标系为基准，计算所述手部空间坐标系旋转至所在空间中的世界坐标系时的四元数；将静态手势对应的观测序列按照所述四元数进行旋转，完成归一化。

5.根据权利要求1所述的三维手势识别方法，其特征在于，所述步骤(3)中，采用GMM-HMM模型对静态手势进行识别的过程包括：
(31)利用外部设备每隔M秒收集一组静态手势数据序列，共收集该静态手势下在空间内转动和移动后的手势数据序列N组，其中M≥1，N≥20；
(32)通过Baum-Welch算法迭代训练对应的GMM-HMM模型，直至模型收敛；
(33)计算N组手势数据序列的前向算法输出值，若当前帧手势数据序列前向算法输出值大于设定阈值θ，即为识别到该手势，否则，未识别到手势。

6.根据权利要求5所述的三维手势识别方法，其特征在于，所述阈值θ∈[α1pav,α2pav]，其中，pav为最后一次训练中计算出的N组训练数据前向算法的输出值的均值，α1＝75％，...

【专利技术属性】
技术研发人员：薛澄岐，贾乐松，周小舟，肖玮烨，苗馨月，邢向向，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人