一种基于Kinect的手写方法技术

技术编号:8980561 阅读:202 留言:0更新日期:2013-07-31 22:42
本发明专利技术公开了一种基于Kinect的手写方法,主要包括如下步骤:步骤1、捕捉视频信息;步骤2、分析处理并分割视频信息,分割得到每一帧图像里面用户的手部;步骤3、分割后的视频信息分为两个模块:手写轨迹定位和字符识别模块与手势识别和响应模块。具有书写的自由度高、使用方便和实用性强等优点。

【技术实现步骤摘要】

本专利技术涉及一种计算机图像处理及模式识别技术,特别涉及,该方法是一种空中虚拟手写的识别和交互的方法。
技术介绍
纵观人机交互的发展史,我们一直在为创造一种更为自然的、用户友好的交互系统而努力,但是在现存的手写系统中,受限于硬件和软件上的制约,依然没有完全达到一种人性化的交互要求:一方面,传统的手写输入系统都需要凭借一定的介质设备,比如键盘、鼠标、电子笔、触摸屏,这种手写的行为与硬件“捆绑”在一起,一定程度上制约着我们手写的自由和应用场合;另一方面,目前国内外在类似的虚拟手写领域的尝试和研究也有不少,但是他们某种层面而言都存在一定的局限性,比如说,对应用场景要有严格的控制,要求背景干净和稳定不变;又或者需要高昂的电子设备,如高精度TOF相机、数据手套等,这些制约着他们的应用方案成为一种实用性的系统;可见现有的手写技术使用的限制很多,使用不方便,实用性差。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供,该方法具有人性化程度高、用户操作友好、可以空中虚拟手写的特点。本专利技术的目的通过下述技术方案实现:,包括如下步骤: 步骤1、捕捉视频信息;步骤2、分析处理并分割视频信息,分割得到每一帧图像里面用户的手部;步骤3、分割后的视频信息分为两个模块:手写轨迹定位和字符识别模块与手势识别和响应模块。所述步骤3中:所述手写轨迹定位和字符识别模块的工作过程包括如下步骤:(A)在人手分割的结果上进行指尖定位,并且存储定位得到的指尖位置;(B)将一次书写检测得到的所有指尖点位置拼接起来得到一个完整字符的连笔进行字符重构,并把重构后的字符输入到字符识别引擎,以得到识别结果输出;所述手势识别和响应模块的工作过程包括如下步骤:(a)在人手分割的结果上提取手部信息特征,所述手部信息特征作为手势识别的输入,如果提取的所述手部信息特征的变化与预先设定的手势的变化规则一致,则可被判定为所述手势正在进行书写,所述手势识别和响应模块检测用户的手势变化作为人机交互的指令并输入手写系统从而实现手写系统的基本功能,所述手写系统包括:用户登入、落笔、抬笔、选择、删除和注销;(b)系统检测到手势,界面做出相应响应。所述步骤I中,采用微软的Kinect传感器来采集视频信息,所述视频信息包括彩色图像和深度图像;并利用Kinect将用户从复杂背景中分离出来。所述步骤2中,所述分析处理并分割视频信息采用了一种混合模型的算法,所述混合模型的算法对肤色模型、深度模型和背景模型分别进行建模;所述肤色模型的分割结果、深度模型的分割结果和背景模型的分割结果被输入到神经网络的评价系统,神经网络输出肤色模型的置信系数、深度模型的置信系数和背景模型的置信系数,分割结果取决于肤色模型、深度模型和背景模型经由置信系数加权之后的综合,所述加权之后的综合指:所述肤色模型的分割结果、深度模型的分割结果和背景模型的分割结果分别乘以各自的置信系数得到三个二值图,然后把所述的三个二值图进行累加,最后把累加的结果经过一个阈值得到最终分割结果。所述步骤2中,所使用的神经网络是一个三层感知器模型,分为输入层、隐藏层和输出层;所述肤色模型、深度模型和背景模型这三个模型分割结果的两两重叠率输入所述神经网络的输入层,重叠率越高意味着分割的结果越好,即吻合度越高;所述肤色模型的置信系数、深度模型的置信系数和背景模型的置信系数由神经网络的输出层输出,置信系数越大意味着相对应模型的可靠性越高(在最终分割结果里面占据更重要的成分);隐藏层具有20个神经元,神经网络的激活函数是sigmod函数。所述步骤(A)中,所述指尖定位采用了双模式切换的指尖定位算法,所述双模式切换的指尖定位算法通过手部的物理模型来决定选用的模式,对不同形态角度的手部自适应地采用相应的指尖定位算法。所述步骤(B)中,在字符重构之后,轨迹点集经由一个均值滤波做平滑,消除因为局部噪声造成的影响;对于一个完整的字符在空中手写系统中,其指尖定位算法采样为n个点,则整个字符可视作n维向量,用字母c表示,所述整个字符的表达式如下:C= (P1, P2, P3,..., Pn),假设Pi为第i个采样点,平滑策略为该点与邻近6个采样点取均值。经由均值滤波器得到的平滑后轨迹在每个点上的数值为:本文档来自技高网...

【技术保护点】
一种基于Kinect的手写方法,其特征在于,包括如下步骤:步骤1、捕捉视频信息;步骤2、分析处理并分割视频信息,分割得到每一帧图像里面用户的手部;步骤3、把分割后的视频信息分为两个模块:手写轨迹定位和字符识别模块与手势识别和响应模块。

【技术特征摘要】
1.一种基于Kinect的手写方法,其特征在于,包括如下步骤: 步骤1、捕捉视频信息; 步骤2、分析处理并分割视频信息,分割得到每一帧图像里面用户的手部; 步骤3、把分割后的视频信息分为两个模块:手写轨迹定位和字符识别模块与手势识别和响应模块。2.根据权利要求1所述的手写方法,其特征在于,步骤3中: 所述手写轨迹定位和字符识别模块的工作过程包括如下步骤: (A)在人手分割的结果上进行指尖定位,并且定位得到的指尖位置; (B)将书写检测得到的所有指尖点位置拼接起来得到完整字符的连笔进行字符重构,并把重构后的字符输入到字符识别引擎,得到识别结果,并输出识别结果; 所述手势识别和响应模块的工作过程包括如下步骤: (a)在人手分割的结果上提取手部信息特征,所述手部信息特征作为手势识别的输入,如果提取的所述手部信息特征的变化与预先设定的手势的变化规则一致,则可被判定为所述手势正在进行书写,所述手势识别和响应模块检测用户的手势变化输入手写系统,所述手写系统包括:用户登入手势操作、落笔手势操作、抬笔手势操作、选择手势操作、删除手势操作和注销手势操作; (b)系统检测到手势,界面做出相应响应。3.根据权利要求1所述的手写方法,其特征在于,步骤I中,采用微软的Kinect传感器来采集视频信息,所述视频信息包括彩色图像深度图像;并利用Kinect将用户的手部从背景中分离出来。4.根据权利要求1所述的手写方法,其特征在于,步骤2中,所述分析处理并分割视频信息采用了一种混合模型的算法,所述混合模型的算法对肤色模型、深度模型和背景模型分别进行建模;所述肤色模型的分割结果、深度模型的分割结果和背景模型的分割结果分别被输入到神经网络的评价系统,所述神经网络输出肤色模型的置信系数、深度模型的置信系数和背景模型的置信系数,所述分割结果取决于肤色模型、深度模型和背景模型经由置信系数加权之后的综合,所述加权之后的综合指:所述肤色模型的分割结果、深度模型的分割结果和背景模型的分割结果分别乘以各自...

【专利技术属性】
技术研发人员:金连文叶植超张鑫
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1