基于细分特征值法的快速三维动态手势识别方法及系统技术方案

技术编号:13670452 阅读:154 留言:0更新日期:2016-09-07 16:10
基于细分特征值法的快速三维动态手势识别方法及系统,针对现有技术中存在的问题,本发明专利技术设计了一个外观小巧的硬件平台,用加速度计来采集用户手势的3轴加速度,陀螺仪来采集用户手势的3轴角速度,磁力计来采集用户手势的3轴磁感应强度,使用滤波算法来消除数据误差之后再进行姿态解算,求出实时的三个姿态角(航向角、横滚角、俯仰角),然后将这些信息数据通过本发明专利技术所提出的特征分析算法,在确保一定的精确度和实时性的基础上,分别对移动、旋转、打钩、画叉、晃动、敲击等自身具有一定区分度的三维动态手势进行识别,从而实现相应的应用。

【技术实现步骤摘要】

本专利技术属于人机交互
,尤其涉及一种动态手势识别方法及系统。
技术介绍
人工智能的发展促使着与其相关的应用层出不穷,其中作为人工智能的重要内容——人机交互技术,也受到越来越多的关注。人机交互研究的是人类如何与机器进行沟通,从而控制机器,自如地实现人们所希望的功能。过去传统的人机交互方式有按键、键盘、触摸屏和语音技术等。但上述方式都在效率、准确性、自然性上存在诸多局限,这也使得人们开始寻找效率更高、交互更加自然的方式。现有的人机交互技术存在以下缺点:(1)机械键盘交互是最成熟,但同时也是最低效的交互方式,因其成本、损耗、低效等各种原因,正在被移动设备慢慢淘汰;(2)触摸屏操作作为近几年新兴的人机交互方式,以其操作简洁、符合用户习惯、学习成本低、可多点触控等优点,成为新一代移动设备有效的交互方式。但是,触控技术不可避免的需要用户在触模板上进行操作,限制了触控技术的应用场景和范围。(3)语音识别目前也是一种非常成熟的交互方式,识别率较高,尤其是随着iPhone中Siri的出现,基于自然语音的识别技术使得语音交互方式迈上了一个新的台阶。然而,语音交互方式会受到地区语言差异以及个人语音差异的影响,同时,自然语音识别需要时刻联网、能耗高的缺点,大大限制了语音技术在可穿戴设备中的应用。随着各方面技术的进步,人们希望得到更好的人机交互体验,对交互的实时性、识别率等硬性指标的要求也越来越苛刻,甚至开始希望通过一些自身的微小信息,例如手指信息、声波信息、眼珠信息、脑电波信息、肌肉信息等来实现与机器的沟通。这促使许多专家学者不断地寻找挖掘更便捷、更快速、更准确、更自然的人机交互方式,并开始关注利用人类自身的身体语言来实现机器控制,而其中手势作为变化方式最多、最能够表达人们意愿的方式之一,成为了关注的重点。在脑电波控制世界的时代来临之前,手势是最有可能改变传统人机交互方式的研究切入点。因为手势是身体姿态最多变、最具有表达性的一项,它可以最大可能地表达人们的想法和意愿。不通过任何媒介,直接利用一个简单的手势动作就可以操控生活,是目前人们所追求的理想人机交互方式。这种全新的操作方式,使得人类在这个物物相连的互联智能时代,真正实现用自己的手来掌控自己的生活。手势也会将人机交互方式从传统的平面二维识别技术扩展到了空间三维识别技术,实现更多技术发展的可能性。本专利技术所要做的三维动态手势识别技术,搭配一个集成了三轴加速度计、三轴陀螺仪、磁力计、处理芯片和低功耗蓝牙的微型硬件平台,来与PC端或其他终端实现友好的人机交互方式。手势识别技术的发展过程中产生过几种主流的解决方案,例如:基于数据手套的方案:起步最早,也是最直接处理问题的一种方案。该方案具有数据量小、速度高、受环境影响较小和能够直接获取手势数据等诸多优点。但是要求用户穿戴复杂的手套,大大降低了用户体验,并且对附着其上的传感器披覆较高硬度的保护层在技术上有一定难度,而相对脆弱的设备在携带上也存在不方便。基于机器视觉的处理方案:当前最热门的手势识别技术解决方案,也就是摄像头图像处理,比如说微软的Kinect。最大的优点是用户无需佩戴任何设备,人机交互性好。但是这种技术对于空间、环境有比较大的限制性,因此除了一些大型的体感游戏使用,在生活中的推广度并不高。基于SEMG的方案:处在多学科交叉的领域,除了和数据手套方案一样需要用户佩戴电极外,和机器视觉的方案类似,该方案也容易受外部环境和用户等因素的干扰。外部环境的干扰包括电磁环境的干扰和环境湿度变化造成的测量电极接触电阻的变化。同时,用户的身体和精神状态在不同的情况下具有不同的基准值,导致系统难以标定。
技术实现思路
为了解决现有技术中问题,本专利技术设计了一个外观小巧的硬件平台,用加速度计采集用户手势的3轴加速度,陀螺仪来采集用户手势的3轴角速度,磁力计来采集用户手势的3轴磁感应强度,使用滤波算法来消除数据误差之后再进行姿态解算,求出实时的三个姿态角(航向角、横滚角、俯仰角),然后将这些信息数据通过本专利技术所提出的特征分析算法,在确保一定的精确度和实时性的基础上,分别对移动、旋转、打钩、画叉、晃动、敲击等自身具有一定区分度的三维动态手势进行识别,从而实现相应的应用。本专利技术通过如下技术方案实现:一种基于细分特征值法的快速三维动态手势识别方法,其特征在于,所述方法将手势定义为敲击类、旋转类、晃动类、移动类、打钩类、画叉类等六大类型,所述方法包括:S1:采用差分法从所有读取到的原始数据中截取从手势的起点到终点的段落;S2:对切割下来的数据段进行坐标系的转换,从机体坐标系转换到用户坐标系;S3:计算变换后数据的手势长度、手势能量、波峰数、角速度能量最大轴、角速度单边性,并利用这五个特征量来构造一个手势大类的预分类器,所述预分类器利用手势能量来进行粗分类,利用波峰数来区分敲击类和移动类,利用角速度能量最大轴来识别旋转类,利用线性判别函数计算细分值f来区分晃动类、打钩类、画叉类;线性判别函数为;f=a*LEN+b*E+c*P+d,其中,LEN为手势长度,E为手势能量,P为加速度波峰数,a,b,c,d为常系数;S4:进一步地进行手势细化分,识别出移动类和旋转类手势的运动方向。作为本专利技术的进一步改进,所述差分法进行手势切割具体为,在一个长度为N的窗口内对加速度和角速度的两两时刻前后数值变化量求和得到经过平滑窗口处理后的加速度和角速度差分值: Δ a c c N = Σ k = i i + N ( | X k a c c - X k - 1 a c c | + | Y k a c c - Y k - 1 a c c | + | Z k a c c - Z k 本文档来自技高网
...

【技术保护点】
一种基于细分特征值法的快速三维动态手势识别方法,其特征在于:所述方法将手势定义为敲击类、旋转类、晃动类、移动类、打钩类、画叉类等六大类型,所述方法包括:S1:采用差分法从所有读取到的原始数据中截取从手势的起点到终点的段落;S2:对切割下来的数据段进行坐标系的转换,从机体坐标系转换到用户坐标系;S3:计算变换后数据的手势长度、手势能量、波峰数、角速度能量最大轴、角速度单边性,并利用这五个特征量来构造一个手势大类的预分类器,所述预分类器利用手势能量来进行粗分类,利用波峰数来区分敲击类和移动类,利用角速度能量最大轴来识别旋转类,利用线性判别函数计算细分值f来区分晃动类、打钩类、画叉类;线性判别函数为;f=a*LEN+b*E+c*P+d,其中,LEN为手势长度,E为手势能量,P为加速度波峰数,a,b,c,d为常系数;S4:进一步地进行手势细化分,识别出移动类和旋转类手势的运动方向。

【技术特征摘要】
1.一种基于细分特征值法的快速三维动态手势识别方法,其特征在于:所述方法将手势定义为敲击类、旋转类、晃动类、移动类、打钩类、画叉类等六大类型,所述方法包括:S1:采用差分法从所有读取到的原始数据中截取从手势的起点到终点的段落;S2:对切割下来的数据段进行坐标系的转换,从机体坐标系转换到用户坐标系;S3:计算变换后数据的手势长度、手势能量、波峰数、角速度能量最大轴、角速度单边性,并利用这五个特征量来构造一个手势大类的预分类器,所述预分类器利用手势能量来进行粗分类,利用波峰数来区分敲击类和移动类,利用角速度能量最大轴来识别旋转类,利用线性判别函数计算细分值f来区分晃动类、打钩类、画叉类;线性判别函数为;f=a*LEN+b*E+c*P+d,其中,LEN为手势长度,E为手势能量,P为加速度波峰数,a,b,c,d为常系数;S4:进一步地进行手势细化分,识别出移动类和旋转类手势的运动方向。2.根据权利要求1所述的手势识别方法,其特征在于:所述差分法进行手势切割具体为,在一个长度为N的窗口内对加速度和角速度的两两时刻前后数值变化量求和得到经过平滑窗口处理后的加速度和角速度差分值: Δ a c c N = Σ k = i i + N ( | X k a c c - X k - 1 a c c | + | Y k a c c - Y k - 1 a c c | + | Z k a c c - Z k - 1 a c c | ) ]]>示k时刻下的三轴角速度值;设定一个阈值,所述差分值超过了所述阈值的时间点是手势的起点,在识别出起点后,若所述差分值出现了小于所述阈值了的时刻点是手势的终点;若加速度和角速度分别检测出来的起点或终点时刻差值如果超过m个采样时间点,则认为该起点或终点无效,反之则有效,其中,m为预设值。3.根据权利要求1所述的手势识别方法,其特征在于:所述波峰数包括加速度波峰数、角速度波峰数和姿态角波峰数。4.根据权利要求1所述的手势识别方法,其特征在于:所述手势长度LEN为手势起点到终点的采样数;手势能量E为起点到终点之间加速度和角速度绝对值之和;波峰数为每个手势动作的加速度或角速度或者姿态角的波峰数;角速度单边性反映在某轴上的角速度呈现出单符号性,3个角速度中只要其中一个满足单边性,就认为其整体角速度满足了单边性;角速度能量最大轴为max(Ewx、Ewy、Ewz)所在的坐标轴,判断轴即为判断旋转轴,其中,角速度能量最大值Ewx、Ewy、Ewz为: E w x = Σ i = A B ...

【专利技术属性】
技术研发人员:韩啸张钦宇刘易谢国超赵国钦刘元震
申请(专利权)人:哈尔滨工业大学深圳研究生院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1