【技术实现步骤摘要】
一种前置摄像头视频源的眼动行为识别方法
本专利技术涉及一种眼动行为识别技术,采用计算机前置网络摄像头采集数据,可以识别用户眼动行为从而触发计算机命令实现人机交互,具体是涉及一种前置摄像头视频源的眼动行为识别方法。
技术介绍
眼动是指瞳孔扫视、凝视、眨眼等基本眼部姿势的变化。眼动交互是人机交互领域中的一项关键性技术,在安保、车辆、助残、仪器、军事、医学、计算机等诸多领域中有广泛的应用前景。目前市场上通常使用眼动仪来完成眼动人机交互的工作。大多数眼动仪工作原理是通过红外摄像头拍摄高清的瞳孔图像,采用基于瞳孔和角膜反射的视频记录法,可以准确定位人眼的注视点。应用到人机交互上,可以完全不使用双手操作计算机,仅依靠注视点的位置就可替代鼠标完成操作。但此类眼动仪大多价格昂贵,校准复杂,通常的使用者是残障人士或是研究工作者,对于不依赖使用眼睛操控计算机的普通人来说,眼动仪性价比不高。现有眼动仪大多价格昂贵校准复杂,大多数用户的需求,只是使用眼动来触发计算机的几个命令即可。复杂的任务若都使用眼动操作反而会导致眼睛疲劳。为此,便利且高效识别出眼动行为是眼动控制人机交互应用普及的关键 ...
【技术保护点】
1.一种前置摄像头视频源的眼动行为识别方法,普通带有摄像头的电脑的前置摄像头正脸采集数据的视频数据识别出人的6种眼势和2种眨眼共计8种眼动行为,对应触发8种计算机命令,其特征在于,具体包括以下四个步骤:步骤一、人脸检测跟踪采用了检测速度较快的方向梯度直方图特征的人脸检测方法,检测到人脸以后,使用基于回归树方法进行人脸关键点定位,定位的4个眼角关键点划分出的含有双眼的矩形区域作为模板;在第二帧中不再重复全图的人脸检测操作,而是使用含有双眼的矩形区域模板进行模板匹配,找到图中匹配的双眼区域来寻找人脸;在第二帧匹配到对应的人眼区域后,扩展出包含人脸的矩形区域再重复进行关键点检测, ...
【技术特征摘要】
1.一种前置摄像头视频源的眼动行为识别方法,普通带有摄像头的电脑的前置摄像头正脸采集数据的视频数据识别出人的6种眼势和2种眨眼共计8种眼动行为,对应触发8种计算机命令,其特征在于,具体包括以下四个步骤:步骤一、人脸检测跟踪采用了检测速度较快的方向梯度直方图特征的人脸检测方法,检测到人脸以后,使用基于回归树方法进行人脸关键点定位,定位的4个眼角关键点划分出的含有双眼的矩形区域作为模板;在第二帧中不再重复全图的人脸检测操作,而是使用含有双眼的矩形区域模板进行模板匹配,找到图中匹配的双眼区域来寻找人脸;在第二帧匹配到对应的人眼区域后,扩展出包含人脸的矩形区域再重复进行关键点检测,假设模板的宽高分别为:W,H;以模板为中心向上扩宽H个像素,向下扩宽H*7/2个像素,宽度不变,即可得到只含人脸区域的图像;得到人脸区域进行关键点定位,基于定位的四个眼角关键点再次划分出的含有双眼的矩形区域更新模板,如此循环,完成人脸的稳定鲁棒跟踪;步骤二、眨眼判断人脸关键点定位的基础上可得到单眼周围的六个特征点p1,p2,p3,p4,p5,p6,使用公式:求出一只眼睛的长宽比,将单眼眨眼作为触发电脑命令的一种眼动行为,并且,左眼单眨眼或右眼单眨眼称为有意眨眼,双眼眨眼称为无意眨眼;步骤三、双眼区域提取和处理以及步骤二的判断,如果判断当前眼睛不是眨眼状态,则进行眼势的判断;基于人脸关键点定位到的四个眼角坐标,按如下计算方法得出每只眼睛的矩形区域:3-1)计算两只眼睛的宽度w;3-2)计算两个眼角坐标的中心坐标(X,Y),以该中心坐标为中心,左右扩展w*3/4的像素区域,上下扩展w*1/2的像素区域;3-3)眼部图像裁剪与增强:截取矩形区域的眼部图像,调整成36*36像素大小,使用边缘保留滤波去除噪声,使用幂次变换提升区域整体对比度,消除部分阴影;步骤四、眼球中心位置标定和眼动行为判别4-1)眼球中心位置标定:在提取出的双眼区域中,计算梯度的方向和幅值,然后取梯度方向相交最多的那个点,即认为是眼球中心,使用(Xc,Yc)表示;4-2)眼势发生判断:使用以下公式计眼球中心坐标(Xc,Yc)与眼睛图像长宽36像素的比值tx,ty:tx=Xc÷36ty=Yc÷36判断眼球是否正在进行一个眼势动作的方法为:A、当眼球中心位置比值tx小于0.30,判断眼球做出了向左移动的眼势;B、当眼球中心位置比值tx大于0....
【专利技术属性】
技术研发人员:黄君浩,贺辉,
申请(专利权)人:北京师范大学珠海分校,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。