一种基于眨眼动作的人机交互方法及系统技术方案

技术编号:8022080 阅读:265 留言:0更新日期:2012-11-29 04:17
本发明专利技术涉及人机交互技术领域,提供了一种基于眨眼动作的人机交互方法,实现用户对电子设备的操作,包括:通过摄像头获取人脸图像;对图像进行人眼区域检测,根据检测到的人眼区域对瞳孔中心进行定位;跟踪瞳孔中心位置;检测眨眼动作,根据检测到的眨眼动作发送相应的控制命令给电子设备。本发明专利技术还提供了一种基于眨眼动作的人机交互系统。本发明专利技术通过摄像头和眼睛检测技术,实现眨眼动作的判断,通过眨眼发出控制命令实现对电子设备的操作,使用户对电子设备的操作简单方便。

【技术实现步骤摘要】

本专利技术涉及人机交互
,特别是涉及一种基于眨眼动作的人机交互方法及系统
技术介绍
随着手机、平板电脑等各类移动终端设备的普及,特别是智能手机的发展,这些智能移动终端的作用已不再是简单的接打电话、收发短信了,各种手机和平板电脑的应用充斥着整个网络,其中最主要的应用包括接打电话、收发短信/邮件、拍照片、浏览网页、玩游戏和阅读电子书。用户与设备之间的人机交互方式也越来越丰富。目前较常用的人机交互方式主要有两种一种是按键型,通过按键来发出命令;另一种是触摸型,触摸屏幕采用电容屏或电阻屏,用户通过手指触摸屏幕发出命令。这两种方式都是基于人手的人机交互 方式,需要手的介入,当双手被占用时,就无法完成人与设备的交互,所以无法适用于某些特殊场合,以及一些残障人士。随着智能信息技术的发展,新的交互方式层出不穷,特别是出现了多种非接触式的操作方式,主要有语音控制和体感控制两种,其中语音控制、动作控制(属于体感控制的一种)等技术已经得到了广泛的应用。基于语音的操作方式,需要用户用声音信号来控制,操作不太方便,且容易受到环境噪音干扰。基于体感的操作方式中,利用眨眼信息实现人机交互是一种新型的人机交互方式。现有的眨眼交互方式要求原图像分辨率高,因此图像采集单元需要分辨率较高的摄像机或摄像头,或者需要红外光源,或者需要头戴式设备如穿戴式头盔、眼镜框等固定在头部或眼部。这些方法在一定程度上都增加了成本,也不适合在普通手机终端上实现。而且,长时间使用红外光源会对人眼有伤害,如果是将额外设备固定在头部或眼部也会给人体造成负担。
技术实现思路
本专利技术通过普通摄像头对眨眼动作进行识别,从而实现对电子设备的操作,无需使用特殊摄像机或特殊摄像头、也无需红外光源及其他辅助装置。本专利技术采用如下技术方案一种基于眨眼动作的人机交互方法,实现用户对电子设备的操作,包括通过摄像头获取人脸图像;对所述图像进行人眼区域检测,根据检测到的人眼区域对瞳孔中心进行定位;跟踪瞳孔中心位置;检测眨眼动作,根据检测到的眨眼动作发送相应的控制命令给电子设备。优选地,所述对所述图像进行人眼区域检测的步骤具体包括采用直方图投影法、Haar检测法、帧差法或者模板匹配法对所述图像进行人眼区域的检测。优选地,所述跟踪瞳孔中心位置的步骤具体包括以所述对所述图像进行人眼区域检测,根据检测到的人眼区域对瞳孔中心进行定位的步骤得到的瞳孔中心作为中心初始化搜索窗口;通过摄像头获取下一帧人脸图像;在下一帧人脸图像中的搜索窗口中对瞳孔中心进行定位。优选地,所述搜索窗口为分别以两个眼睛的瞳孔中心为中心的两个矩形搜索框,所述矩形搜索框的高度为人脸图像高度的五分之一,所述矩形搜索框的宽度为人脸图像宽度的三分之一。优选地,在所述通过摄像头获取下一帧人脸图像的步骤之后还包括判断所述矩形搜索框是否超出下一帧人脸图像的范围;当矩形搜索框超出下一帧人脸图像的范围时,将矩形搜索框超出下一帧人脸图像 的部分滤除。优选地,所述根据检测到的人眼区域对瞳孔中心进行定位的步骤和在下一帧人脸图像中的搜索窗口中对瞳孔中心进行定位的步骤均包括定义眼睛的等照度线;计算眼睛的等照度线曲率,得到眼睛的等照度曲线图;计算等照度曲线图中满足等照度线曲率的圆的中心。优选地,所述计算等照度曲线图中满足等照度线曲率的圆的中心的步骤具体包括计算等照度线的中心的位移矢量;采用投票法将所述位移矢量映射到累加器中形成等照度线中心图;将累加器与高斯核作卷积运算,使每个位移矢量均形成一个单一的中心估计;计算每个位移矢量的权重,选取权重值较大的位移矢量对应的等照度线作为特定等照度线;选取等照度线中心图中特定等照度线中心附近的较强响应区内的候选响应中强度最大的点作为瞳孔中心。优选地,所述方法还包括采用下采样方法由通过摄像头获取的图像构造出图像金字塔,对图像金字塔中的每一层图像求得等照度线中心图金字塔,将等照度线中心图金字塔中的等照度线中心图缩放到预定大小并线性相加得到最终的等照度线中心图。优选地,在所述在下一帧人脸图像中的搜索窗口中对瞳孔中心进行定位的步骤之后还包括判断在下一帧人脸图像中的搜索窗口中对瞳孔中心进行定位得到的瞳孔中心位置与根据检测到的人眼区域对瞳孔中心进行定位得到的瞳孔中心位置之间的距离是否超过预设距离L ;超过预设距离L则返回执行通过摄像头获取人脸图像的步骤。优选地,所述检测眨眼动作,根据检测到的眨眼动作发送相应的控制命令给电子设备的步骤具体包括检测是否有单只眼睛眨眼;当有单只眼睛眨眼时,检测连续眨眼次数和眨眼眼睛类别;根据预设的连续眨眼次数和眨眼眼睛类别与控制命令的对应关系,发送相应的控制命令给电子设备。优选地,所述当有单只眼睛眨眼时,检测连续眨眼次数和眨眼眼睛类别的步骤具体包括当有单只眼睛眨眼时,开始计时,检测在预设时间t内连续眨眼次数和眨眼眼睛类别。优选地,所述预设的连续眨眼次数和眨眼眼睛类别与控制命令的对应关系包括当所述基于眨眼动作的人机交互方法用于阅读电子书时,连续眨2次左眼发送向上翻页的控制命令,连续眨2次右眼发送向下翻页的控制命令;当所述基于眨眼动作的人机交互方法用于浏览网页时,连续眨2次左眼发送向上浏览的控制命令,连续眨2次右眼发送向下浏览的控制命令;当所述基于眨眼动作的人机交互方法用于查看图片或照片时,连续眨2次左眼发送查看上一张图片或照片的控制命令,连续眨2次右眼发送查看下一张图片或照片的控制 命令;当所述基于眨眼动作的人机交互方法用于接听或挂断电话时,连续眨2次左眼发送接听电话的控制命令,连续眨2次右眼发送挂断电话的控制命令。优选地,所述摄像头为电子设备自带的前置摄像头,所述电子设备为手机或平板电脑。本专利技术还提供了一种基于眨眼动作的人机交互系统,实现用户对电子设备的操作,所述系统包括电子设备和摄像头,所述系统采用前述的方法进行人机交互。本专利技术公开的基于眨眼动作的人机交互方法及系统,通过普通摄像头和眼睛检测技术,实现眨眼动作的判断,通过眨眼发出控制命令实现对电子设备的操作,例如阅读电子书、浏览网页、查看图片或照片、接听或挂断电话、玩简单的互动操作游戏时,可通过眨眼实现向上/向下翻页、放大/缩小、向上/向下浏览、查看上一张/下一张图片或照片、接/挂电话等,使用户对电子设备的操作简单方便。本方案无需使用特殊摄像机或特殊摄像头,也无需红外光源及其他辅助装置,易于实现,成本较低,且对人眼无红外光源的伤害,也不会给人体造成额外负担。附图说明图I为本专利技术实施例I基于眨眼动作的人机交互方法流程图;图2为眼睛的等照度曲线图;图3为本专利技术实施例I中瞳孔中心定位流程图; 图4为本专利技术实施例I中眼睛追踪流程图;图5为本专利技术实施例I中控制命令发送流程图;图6为本专利技术实施例2基于眨眼动作的人机交互方法中眼睛追踪流程图;图7为用于阅读电子书的本专利技术实施例3基于眨眼动作的人机交互方法中控制命令发送流程图;图8为用于阅读电子书的本专利技术实施例4基于眨眼动作的人机交互方法中控制命令发送流程图;图9为用于浏览网页的本专利技术实施例5基于眨眼动作的人机交互方法中控制命令发送流程图10为用于查看图片或照片的本专利技术实施例6基于眨眼动作的人机交互方法中控制命令发送流程图;图11为用于接听或挂断电话的本专利技术实施例7基于眨眼动作的人机交互方法中控制命令发送流程本文档来自技高网...

【技术保护点】
一种基于眨眼动作的人机交互方法,实现用户对电子设备的操作,其特征在于,包括:通过摄像头获取人脸图像;对所述图像进行人眼区域检测,根据检测到的人眼区域对瞳孔中心进行定位;跟踪瞳孔中心位置;检测眨眼动作,根据检测到的眨眼动作发送相应的控制命令给电子设备。

【技术特征摘要】

【专利技术属性】
技术研发人员:宋展武照敏聂磊
申请(专利权)人:深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1