一种基于改进VIBE的手势检测方法技术

技术编号:22262173 阅读:19 留言:0更新日期:2019-10-10 14:51
本发明专利技术涉及一种基于改进VIBE的手势检测方法,通过摄像头采集视频,取得若干视频帧图像并进行预处理,使用改进的VIBE算法进行手势检测后,对得到的手势帧图像进行形态学处理,得到处理后的手势。本发明专利技术利用LBP纹理特征构建真实场景参考帧,利用参考帧和背景样本集的交替作用实现对背景的逐渐更新。检测手势过程中充分利用了像素点的空间信息和时间信息,消除了由动态背景产生的误检,提高了手势检测的准确率。此外,LBP纹理特征对光照不敏感,利用LBP纹理特征构建真实场景可以很好适应光照变化。

A gesture detection method based on improved VIBE

【技术实现步骤摘要】
一种基于改进VIBE的手势检测方法
本专利技术涉及计算;推算;计数的
,特别涉及一种目标检测领域的基于改进VIBE的手势检测方法。
技术介绍
随着人们生活水平的提高,人机交互技术的交互方式将从以机器为中心逐渐转变为以人为中心。现今的人机交互技术,大多以点触式交互和键盘鼠标交互为主,这些交互方式都需要操作人员去学习机器的操作方式,这显然已经无法满足人们的需求,探索并实现更新颖的人机交互方式是一项值得研究的课题。新的人机交互方式包括计算机对人的脸部、手势以及人体姿态的识别,也就是采用非接触屏幕的方式进行直接交互,与传统的人机交互方式相比较,新的人机交互方式更多样化,将会有更好的用户体验。这其中,通过手势建立人与计算机之间的交流更加直接简便,其表达形式也更为丰富,并且手势检测技术还可以作为手势识别和人体姿态识别等技术发展的基础。现有技术中的手势检测方法根据其处理维度的不同,大致可以分为三维和二维两种。三维的手势检测方法一般使用多目摄像头或Kinect体感设备获取深度图像,再基于得到的深度信息进行手势检测,然而,这种方法对于硬件设备的要求很高;而二维的手势检测方法大多采用单目摄像头获取图像,再使用高性能的算法提取手势信息,进行手势检测,但现有的二维手势检测方法很容易受到背景环境的干扰,存在精度低、适应性差等诸多问题,且当背景环境中存在类肤色物体或背景环境剧烈变化时,手势检测将受到干扰。现有技术还有VIBE(VisualBackgroundExtractor)算法,其是一种基于运动的前景检测算法,对运动的手势进行检测时可以排除静止的类肤色物体的干扰,并且实时性很好,但是当背景发生变化时,检测运动的手势时仍然会受到干扰。
技术实现思路
本专利技术解决了现有技术中,二维手势检测方法很容易受到背景环境的干扰,存在精度低、适应性差等诸多问题,且当背景环境中存在类肤色物体或背景环境剧烈变化时,手势检测将受到干扰的问题,提供了一种优化的基于改进VIBE的手势检测方法。本专利技术所采用的技术方案是,一种基于改进VIBE的手势检测方法,所述方法包括以下步骤:步骤1:利用摄像头采集视频;步骤2:对于步骤1采集的视频取得若干视频帧图像,对所述视频帧图像进行预处理;步骤3:使用改进的VIBE算法进行手势检测;步骤4:对步骤3得到的手势帧图像进行形态学处理,得到处理后的手势。优选地,所述步骤1中,视频中存在至少2帧包括完整手部的视频帧图像。优选地,所述步骤2中,所述预处理为对得到的视频帧图像进行灰度化处理。优选地,所述步骤3包括以下步骤:步骤3.1:定义用于跟踪真实场景的参考帧B(x,y),参考帧B(x,y)表示真实背景在位置(x,y)处的像素值,以B0(x,y)作为第一帧的真实背景初始化;若此后存在新的一帧图像,则更新B(x,y)为Bt(x,y)=Bt-1(x,y)+(1-Pt(x,y))(It(x,y)-Bt-1(x,y)),其中,Bt(x,y)为当前帧的真实背景,Bt-1(x,y)为前一帧的背景,It(x,y)为当前帧,Pt(x,y)为像素为前景的概率;步骤3.2:以预处理后的第一帧视频帧图像作为背景,对第一帧图像的每个位置的像素点x建立一个大小为N的背景样本集M(x),N>0;步骤3.3:遍历每帧图像的每个位置的像素点,计算当前像素点g(x)与其背景样本集M(x)中每个样本值vi的欧式距离,得到距离D=|g(x)-vi|,其中g(x)和vi分别为当前像素点的像素值和背景样本集中每个样本值的像素值;步骤3.4:若距离D小于半径R,则认为当前像素点与背景样本集中的样本值匹配,统计匹配总个数;若匹配总个数大于设定的阈值时,则认为当前像素点是背景点,否则为前景点;步骤3.5:记录当前分类为背景的点与背景样本集中欧氏距离最大的点;步骤3.6:将分类为背景的像素点以Q的概率更新其背景样本集中与其欧氏距离最大的样本点,同时以Q的概率更新到当前分类为背景点的5×5邻域中任一像素点的背景样本集M(x)中;步骤3.7:对分类为前景的像素进行二次检测,获得最终的背景样本集,按照背景样本集,分割出当前视频帧图像的手势前景;步骤3.8:若还存在未处理完的视频帧,则返回步骤3.3,否则,进行步骤4。优选地,所述步骤3.1中,其中,LBP(It(x,y))为当前帧的LBP纹理特征图,LBP(Bt-1(x,y))为前一帧背景的LBP纹理特征图,ones(x)为x的二进制表示中1的个数,P为5×5邻域上的像素个数。优选地,所述步骤3.2中,遍历视频帧图像的每个像素点,从像素点x的5×5邻域中以等概率抽取n个像素点作为背景样本集M(x),M(x)={v1,v2,…vn},其中,vi是背景样本像素值,1≤i≤n。优选地,所述步骤3.4中,半径R为15~25,阈值为1~3。优选地,所述步骤3.6中,Q为1/18~1/12。优选地,所述步骤3.7中,二次检测包括以下步骤:步骤3.7.1:若|It(x,y)-Bt-1(x,y)|≤1,则像素点It(x,y)是真实背景像素;步骤3.7.2:将二次检验分类为背景的像素点It(x,y)更新到点(x,y)的背景样本集中,同时以概率Q更新到5×5邻域的任一像素的背景样本集中。优选地,所述步骤4包括以下步骤:步骤4.1:对步骤3得到的手势帧图像进行二值化处理,得到二值图像,以0和1分别表示前景图像和背景图像,得到手势和背景;步骤4.2:对前景图像进行形态学闭运算,消除若干黑斑,得到处理后的手势。本专利技术提供了一种优化的基于改进VIBE的手势检测方法,通过摄像头采集视频,取得若干视频帧图像并进行预处理,使用改进的VIBE算法进行手势检测后,对得到的手势帧图像进行形态学处理,得到处理后的手势。本专利技术利用LBP纹理特征构建真实场景参考帧,利用参考帧和背景样本集的交替作用实现对背景的逐渐更新。检测手势过程中充分利用了像素点的空间信息和时间信息,消除了由动态背景产生的误检,提高了手势检测的准确率。此外,LBP纹理特征对光照不敏感,利用LBP纹理特征构建真实场景可以很好适应光照变化。具体实施方式下面结合实施例对本专利技术做进一步的详细描述,但本专利技术的保护范围并不限于此。本专利技术涉及一种基于改进VIBE的手势检测方法,所述方法包括以下步骤。步骤1:利用摄像头采集视频。所述步骤1中,视频中存在至少2帧包括完整手部的视频帧图像。步骤2:对于步骤1采集的视频取得若干视频帧图像,对所述视频帧图像进行预处理。所述步骤2中,所述预处理为对得到的视频帧图像进行灰度化处理。步骤3:使用改进的VIBE算法进行手势检测。本专利技术中,步骤3中一般采用5×5邻域,保证计算量与精确度间的平衡。所述步骤3包括以下步骤。步骤3.1:定义用于跟踪真实场景的参考帧B(x,y),参考帧B(x,y)表示真实背景在位置(x,y)处的像素值,以B0(x,y)作为第一帧的真实背景初始化;若此后存在新的一帧图像,则更新B(x,y)为Bt(x,y)=Bt-1(x,y)+(1-Pt(x,y))(It(x,y)-Bt-1(x,y)),其中,Bt(x,y)为当前帧的真实背景,Bt-1(x,y)为前一帧的背景,It(x,y)为当前帧,Pt(x,y)为像素为前景的概率。所述步骤3.1中,其中,LBP(It(x本文档来自技高网
...

【技术保护点】
1.一种基于改进VIBE的手势检测方法,其特征在于:所述方法包括以下步骤:步骤1:利用摄像头采集视频;步骤2:对于步骤1采集的视频取得若干视频帧图像,对所述视频帧图像进行预处理;步骤3:使用改进的VIBE算法进行手势检测;步骤4:对步骤3得到的手势帧图像进行形态学处理,得到处理后的手势。

【技术特征摘要】
1.一种基于改进VIBE的手势检测方法,其特征在于:所述方法包括以下步骤:步骤1:利用摄像头采集视频;步骤2:对于步骤1采集的视频取得若干视频帧图像,对所述视频帧图像进行预处理;步骤3:使用改进的VIBE算法进行手势检测;步骤4:对步骤3得到的手势帧图像进行形态学处理,得到处理后的手势。2.根据权利要求1所述的一种基于改进VIBE的手势检测方法,其特征在于:所述步骤1中,视频中存在至少2帧包括完整手部的视频帧图像。3.根据权利要求1所述的一种基于改进VIBE的手势检测方法,其特征在于:所述步骤2中,所述预处理为对得到的视频帧图像进行灰度化处理。4.根据权利要求1所述的一种基于改进VIBE的手势检测方法,其特征在于:所述步骤3包括以下步骤:步骤3.1:定义用于跟踪真实场景的参考帧B(x,y),参考帧B(x,y)表示真实背景在位置(x,y)处的像素值,以B0(x,y)作为第一帧的真实背景初始化;若此后存在新的一帧图像,则更新B(x,y)为Bt(x,y)=Bt-1(x,y)+(1-Pt(x,y))(It(x,y)-Bt-1(x,y)),其中,Bt(x,y)为当前帧的真实背景,Bt-1(x,y)为前一帧的背景,It(x,y)为当前帧,Pt(x,y)为像素为前景的概率;步骤3.2:以预处理后的第一帧视频帧图像作为背景,对第一帧图像的每个位置的像素点x建立一个大小为N的背景样本集M(x),N>0;步骤3.3:遍历每帧图像的每个位置的像素点,计算当前像素点g(x)与其背景样本集M(x)中每个样本值vi的欧式距离,得到距离D=|g(x)-vi|,其中g(x)和vi分别为当前像素点的像素值和背景样本集中每个样本值的像素值;步骤3.4:若距离D小于半径R,则认为当前像素点与背景样本集中的样本值匹配,统计匹配总个数;若匹配总个数大于设定的阈值时,则认为当前像素点是背景点,否则为前景点;步骤3.5:记录当前分类为背景的点与背景样本集中欧氏距离最大的点;步骤3.6:将分类为背景的像素点以Q的概率更新背景样本集中与其欧氏距离最大的样本点,同时以Q的概率更新到当...

【专利技术属性】
技术研发人员:张美玉杨美菱简琤峰
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1