基于正视的人机交互方法与系统技术方案

技术编号：16365202 阅读：40 留言：0更新日期：2017-10-10 21:09

本发明专利技术提供一种基于正视的人机交互方法与系统，获取通过图像采集设备采集的用户与设备处于相对正视状态下的正视图像数据，采集用户当前图像数据，将当前采集的图像数据与正视图像数据比较，当一致时，通过计算机的视觉识别技术和语音识别技术识别用户行为和意图，根据预设用户的行为与意图与操作对应关系，控制设备执行与用户当前的行为与意图对应的操作。整个过程中，基于图像采集设备采集的图像数据进行正视判定，并以用户与设备的正视状态判定作为人机交互前提条件，整个人机交互过程自然，另外采用包括人脸识别、语音识别、手势识别、唇语识别、瞳孔识别以及虹膜识别的多种计算机的视觉识别技术和语音识别技术识别用户下一步动作，能够实现多样式人机交互。

Human computer interaction method and system based on face up

The present invention provides a system and method of human-computer interaction based on face, and get the user equipment through the image acquisition equipment acquisition in the relative state of the face face image data, collecting user current image data, compared with the face image data will be collected when the current image data, consistent, through computer vision recognition technology and voice recognition of user behavior and intention, according to the corresponding relations between presupposition and user behavior and intention and the operation, control equipment and implementation of the user's current behavior and intention of the corresponding operation. In the whole process, image data acquisition equipment acquisition based on face to face judgment, and determine the state as a condition of human-computer interaction and user premise equipment, the whole process of natural human-computer interaction, the other uses include face recognition, speech recognition, gesture recognition, lip recognition, iris recognition and iris recognition of a variety of computer vision recognition technology and the speech recognition technology to identify the user next action, can realize the multi style human-computer interaction.

全部详细技术资料下载

【技术实现步骤摘要】
基于正视的人机交互方法与系统
本专利技术涉及人机交互
，特别是涉及基于正视的人机交互方法与系统。
技术介绍
人机交互是指人与设备之间使用某种对话语言，以一定的交互方式，为完成确定任务的人与设备之间的信息交换过程。随着科学技术的发展，人机交互技术的应用领域越来越宽广，小如收音机的播放按键，大至飞机上的仪表板、或是发电厂的控制室，用户都可以通过人机交互界面与系统交流，并进行操作。目前在人机交互技术中，主流的人机交互方式主要包括3种，第一种是传统按键方式；第二种是特定语音词激活方式，如：在对话前先说“小冰你好”，设备才识别后面所听到的语音；第三种是“举手发言”，即先用一个特定手势动作来让设备启动语音识别。上述人机交互方式，虽然在一定程度上可以实现人机交互功能，但是由于交互方式单一，需要预先设定一定特定手势动作，交互过程并不十分自然，在一定程度上给用户操作带来不便。
技术实现思路
基于此，有必要针对一般人机交互方式单一且不自然给用户带来不便操作的问题，提供一种人机交互方式多样，且交互过程自然，给用户带来便捷操作的基于正视的人机交互方法与系统。一种基于正视的人机交互方法，包括步骤：获取通过图像采集设备采集的用户与设备处于相对正视状态下的正视图像数据；通过图像采集设备实时采集用户当前图像数据，将当前采集的图像数据与正视图像数据比较；当当前采集的图像数据和正视图像数据一致时，判定用户与设备处于相对正视状态；当用户与设备处于相对正视状态时，通过计算机的视觉识别技术和语音识别技术识别用户行为和意图，根据预设用户的行为与意图与操作对应关系，控制设备执行与用户当前的行为与意图...
基于正视的人机交互方法与系统

【技术保护点】
一种基于正视的人机交互方法，其特征在于，包括步骤：获取通过图像采集设备采集的用户与设备处于相对正视状态下的正视图像数据；通过所述图像采集设备实时采集用户当前图像数据，将当前采集的图像数据与所述正视图像数据比较；当所述当前采集的图像数据和所述正视图像数据一致时，判定用户与设备处于相对正视状态；当用户与设备处于相对正视状态时，通过计算机的视觉识别技术和语音识别技术识别用户行为和意图，根据预设用户的行为与意图与操作对应关系，控制设备执行与用户当前的行为与意图对应的操作，所述计算机的视觉识别技术和语音识别技术包括人脸识别、语音识别、语义理解、手势识别、唇语识别、声纹识别、表情识别、年龄识别、卡片识别、人脸跟踪、瞳孔识别以及虹膜识别。

【技术特征摘要】
1.一种基于正视的人机交互方法，其特征在于，包括步骤：获取通过图像采集设备采集的用户与设备处于相对正视状态下的正视图像数据；通过所述图像采集设备实时采集用户当前图像数据，将当前采集的图像数据与所述正视图像数据比较；当所述当前采集的图像数据和所述正视图像数据一致时，判定用户与设备处于相对正视状态；当用户与设备处于相对正视状态时，通过计算机的视觉识别技术和语音识别技术识别用户行为和意图，根据预设用户的行为与意图与操作对应关系，控制设备执行与用户当前的行为与意图对应的操作，所述计算机的视觉识别技术和语音识别技术包括人脸识别、语音识别、语义理解、手势识别、唇语识别、声纹识别、表情识别、年龄识别、卡片识别、人脸跟踪、瞳孔识别以及虹膜识别。2.根据权利要求1所述的基于正视的人机交互方法，其特征在于，所述通过计算机的视觉识别技术和语音识别技术识别用户行为和意图，根据预设用户的行为与意图与操作对应关系，控制设备执行与用户当前的行为与意图对应的操作的步骤包括：对用户与设备处于相对正视状态的时间进行计时；当用户与设备处于相对正视状态的时间大于预设时间时，通过计算机的视觉识别技术和语音识别技术识别用户行为和意图，根据预设用户的行为与意图与操作对应关系，控制设备执行与用户当前的行为与意图对应的操作。3.根据权利要求2所述的基于正视的人机交互方法，其特征在于，所述当用户与设备处于相对正视状态的时间大于预设时间时，通过计算机的视觉识别技术和语音识别技术识别用户行为和意图，根据预设用户的行为与意图与操作对应关系，控制设备执行与用户当前的行为与意图对应的操作的步骤之后还包括：查找预设与用户身份匹配的视频图像数据，控制设备显示查找到的视频图像数据。4.根据权利要求1所述的基于正视的人机交互方法，其特征在于，所述通过计算机的视觉识别技术和语音识别技术识别用户行为和意图，根据预设用户的行为与意图与操作对应关系，控制设备执行与用户当前的行为与意图对应的操作的步骤包括：对所述用户进行语音识别和唇语识别；当语音识别结果和唇语识别结果一致时，控制设备响应所述用户的语音操作。5.根据权利要求1所述的基于正视的人机交互方法，其特征在于，所述通过计算机的视觉识别技术和语音识别技术识别用户行为和意图，根据预设用户的行为与意图与操作对应关系，控制设备执行与用户当前的行为与意图对应的操作的步骤包括：对所述用户进行语音识别和语义理解；当语音识别结果和语义理解的结果与设备当前场景相符时，控制设备响应所述用户的语音操作。6.根据权利要求1所述的基于正视的人机交互方法，其特征在于；所述当所述当前采集的图像数据和所述正视图像数据一致时，判定用户与设备处于相对正视状态的步骤之前还包括：当侦测到用户时，定位所述用户的面部位置为音源位置；将声音采集设备正对所述音源位置；所述通过计算机的视觉...

【专利技术属性】
技术研发人员：刘国华，
申请(专利权)人：刘国华，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人