一种结合人脸信息的语音控制方法及系统技术方案

技术编号:20047536 阅读:46 留言:0更新日期:2019-01-09 05:01
本发明专利技术提出一种结合人脸信息的语音控制方法及系统,通过本发明专利技术所提供的一种结合人脸信息的语音控制方法及系统可实现通过一个摄像头获取多个智能设备的人脸信息,避免了每个设备都必须单独配置摄像头的情况,降低了智能设备的制作成本;并且可通过人脸加语音结合的操作方式,使目标用户判断更明确,实现了在多个用户同时使用本系统时以权限更高的用户发出的指令为准的功能;并通过获取用户的眼球信息判断用户的操控目标,判断更精确,避免了误操作情况的出现。

【技术实现步骤摘要】
一种结合人脸信息的语音控制方法及系统
本专利技术涉及智能操作领域,具体涉及一种结合人脸信息的语音控制方法及系统。
技术介绍
目前,大部分复杂的家电都是通过遥控器的键盘输入方式进行遥控的,随着家居的智能化以及包含内容的多样化,为了优化操作方式、增强操作的舒适性,用户需要更加易于操作的遥控器。语言是人类最直接最方便的交流和表达方式,如果采用语音识别技术,可以将原来的被动静止结构转变为具有主动识别语音执行的智慧工具,从而满足人们日益增长的需求。近年来,语音识别技术发展十分迅速,目前已出现了许多自动语音识别类的产品,例如IBM开发的ViaVoice语音系统等。但是这些系统仍然缺乏较强的抗干扰能力,在这种背景下,一些结合人脸识别以及语音系统的智能产品应运而生,但是当这些系统应用到真实环境中时,基本上每一个智能产品都需要单独设置一个摄像头,成本十分高昂,而且在同时应用多个该类产品是,很容易造成各个产品之间的操作信号相互串扰,导致设备的误操作,并且这样的应用环境十分常见,如:办公室、汽车、工厂或机场等,就连家庭环境也是如此。
技术实现思路
为了解决上述问题,本专利技术提供了一种结合人脸信息的语音控制方法及系统,通过本专利可实现通过一个摄像头获取多个智能设备的人脸信息,降低了智能设备的制作成本;并且可通过人脸加语音结合的操作方式,并通过获取用户的眼球信息判断用户的操控目标,判断更精确,避免了误操作情况的出现。第一方面,本专利技术提供了一种结合人脸信息的语音控制方法,具体包括:获取用户的人脸信息;获取预设数据库,所述预设数据库包括至少一条预设人脸信息;当所获取的用户人脸信息与预设数据库中的预设人脸信息匹配时,记所述用户为目标用户;获取所述目标用户的眼球滚动数据;根据所述目标用户的眼球滚动数据获取所述目标用户的控制目标;获取与所述控制目标匹配的第一预设语音控制指令库;获取目标用户发出的语音控制指令;当所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令匹配时;执行所述语音控制指令对应的操作。在本专利技术一实施例中,所述获取预设数据库,所述预设数据库包括至少一条预设人脸信息之后,还包括:当所获取的用户人脸信息与预设数据库中的预设人脸信息不匹配时;不获取所述用户的眼球滚动数据。在本专利技术一实施例中,所述获取与所述控制目标匹配的第一预设语音控制指令库之前,还包括:获取第一用户及第二用户的人脸信息;获取预设数据库,所述预设数据库包括至少两条预设人脸信息;当所获取的第一用户人脸信息与预设数据库中的预设人脸信息匹配时,获取第一用户的眼球滚动数据;当所获取的第二用户人脸信息与预设数据库中的预设人脸信息匹配时,获取第二用户的眼球滚动数据;根据所述第一用户的眼球滚动数据获取所述第一用户的第一目标;根据所述第二用户的眼球滚动数据获取所述第二用户的第二目标;当所述第一目标与所述第二目标一致时,记所述第一目标、第二目标为控制目标;分别获取与所述第一用户的人脸信息及第二用户的人脸信息匹配的预设优先级,并记其中优先级最高的用户为目标用户。在本专利技术一实施例中,所述当所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令匹配时之后,还包括:获取所述目标用户与与所述控制目标匹配的第二预设语音控制指令库;判断当所述目标用户发出的语音控制指令与第二预设语音控制指令库中任意一条指令匹配时;不执行所述语音控制指令对应的操作。在本专利技术一实施例中,所述获取目标用户发出的语音控制指令之后,还包括:当所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令不匹配时;不执行所述语音控制指令对应的操作。第二方面,本专利技术提供了一种结合人脸的语音控制装置,其中包括存储器、至少一个处理器及可执行代码,所述存储器用于存储可执行代码;所述处理经配置以执行所述可执行代码,以实现如本专利技术第一方面所述一种结合人脸的语音控制方法。第三方面,本专利技术包括一种结合人脸信息的语音控制系统,包括摄像头、处理模块、人脸信息匹配模块、眼球数据获取模块、目标判断模块、语音指令获取模块、语音指令匹配模块以及语音指令匹配模块,各个模块之间耦合相连;所述摄像头用于获取用户的人脸信息;所述处理模块用于获取预设数据库,所述预设数据库包括至少一条预设人脸信息;所述人脸信息匹配模块用于判断当所获取的用户人脸信息与预设数据库中的预设人脸信息匹配时,记所述用户为目标用户;所述眼球数据获取模块用于获取所述目标用户的眼球滚动数据;所述目标判断模块用于根据所述目标用户的眼球滚动数据获取所述目标用户的控制目标;所述语音指令获取模块用于获取与所述控制目标匹配的第一预设语音控制指令库;所述语音指令获取模块还用于获取目标用户发出的语音控制指令;所述语音指令匹配模块用于将所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令进行比较;当所述语音指令匹配模块判断所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令匹配时,所述处理模块还用于执行所述语音控制指令对应的操作。在本专利技术一实施例中,所述一种结合人脸信息的语音控制系统还包括权限获取模块,所述权限获取模块与其他模块耦合相连;所述摄像头还用于获取第一用户及第二用户的人脸信息;所述处理模块还用于获取预设数据库,所述预设数据库包括至少两条预设人脸信息;所述人脸信息匹配模块还用于判断当所获取的第一用户人脸信息与预设数据库中的预设人脸信息匹配时,获取第一用户的眼球滚动数据;所述人脸信息匹配模块还用于判断当所获取的第二用户人脸信息与预设数据库中的预设人脸信息匹配时,获取第二用户的眼球滚动数据;所述目标判断模块还用于根据所述第一用户的眼球滚动数据获取所述第一用户的第一目标;所述目标判断模块还用于根据所述第二用户的眼球滚动数据获取所述第二用户的第二目标;所述处理模块还用于判断当所述第一目标与所述第二目标一致时,记所述第一目标、第二目标为控制目标;所述权限获取模块用于分别获取与所述第一用户的人脸信息及第二用户的人脸信息匹配的预设优先级,并记其中优先级最高的用户为目标用户。在本专利技术一实施例中,所述语音指令匹配模块还用于将所述目标用户发出的语音控制指令与第二预设语音控制指令库中所有指令进行比较;当所述语音指令匹配模块判断所述目标用户发出的语音控制指令与第二预设语音控制指令库中任意一条指令匹配时,所述处理模块还用于不执行所述语音控制指令对应的操作。在本专利技术一实施例中,所述一种结合人脸的语音控制系统还包括:当所述语音指令匹配模块判断所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令不匹配时,所述处理模块还用于不执行所述语音控制指令对应的操作。本专利技术的有益效果有:通过本专利所提供的一种结合人脸信息的语音控制方法及系统,可实现通过一个摄像头获取多个智能设备的人脸信息,避免了每个设备都必须单独配置摄像头的情况,降低了智能设备的制作成本;并且可通过人脸加语音结合的操作方式,使目标用户判断更明确,实现了在多个用户同时使用本系统时以权限更高的用户发出的指令为准的功能;并通过获取用户的眼球信息判断用户的操控目标,判断更精确,避免了误操作情况的出现。附图说明图1为本专利技术一实施例中一种结合人脸以及语音的智能操作方法的方法流程图;图2为本专利技术另一实施例中本文档来自技高网...

【技术保护点】
1.一种结合人脸信息的语音控制方法,其特征在于,包括:获取用户的人脸信息;获取预设数据库,所述预设数据库包括至少一条预设人脸信息;当所获取的用户人脸信息与预设数据库中的预设人脸信息匹配时,记所述用户为目标用户;获取所述目标用户的眼球滚动数据;根据所述目标用户的眼球滚动数据获取所述目标用户的控制目标;获取与所述控制目标匹配的第一预设语音控制指令库;获取目标用户发出的语音控制指令;当所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令匹配时;执行所述语音控制指令对应的操作。

【技术特征摘要】
1.一种结合人脸信息的语音控制方法,其特征在于,包括:获取用户的人脸信息;获取预设数据库,所述预设数据库包括至少一条预设人脸信息;当所获取的用户人脸信息与预设数据库中的预设人脸信息匹配时,记所述用户为目标用户;获取所述目标用户的眼球滚动数据;根据所述目标用户的眼球滚动数据获取所述目标用户的控制目标;获取与所述控制目标匹配的第一预设语音控制指令库;获取目标用户发出的语音控制指令;当所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令匹配时;执行所述语音控制指令对应的操作。2.如权利要求1所述的一种结合人脸信息的语音控制方法,其特征在于,所述获取预设数据库,所述预设数据库包括至少一条预设人脸信息之后,还包括:当所获取的用户人脸信息与预设数据库中的预设人脸信息不匹配时;不获取所述用户的眼球滚动数据。3.如权利要求1所述的一种结合人脸信息的语音控制方法,其特征在于,所述获取与所述控制目标匹配的第一预设语音控制指令库之前,还包括:获取第一用户及第二用户的人脸信息;获取预设数据库,所述预设数据库包括至少两条预设人脸信息;当所获取的第一用户人脸信息与预设数据库中的预设人脸信息匹配时,获取第一用户的眼球滚动数据;当所获取的第二用户人脸信息与预设数据库中的预设人脸信息匹配时,获取第二用户的眼球滚动数据;根据所述第一用户的眼球滚动数据获取所述第一用户的第一目标;根据所述第二用户的眼球滚动数据获取所述第二用户的第二目标;当所述第一目标与所述第二目标一致时,记所述第一目标、第二目标为控制目标;分别获取与所述第一用户的人脸信息及第二用户的人脸信息匹配的预设优先级,并记其中优先级最高的用户为目标用户。4.如权利要求1所述的一种结合人脸信息的语音控制方法,其特征在于,所述当所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令匹配时之后,还包括:获取所述目标用户与所述控制目标匹配的第二预设语音控制指令库;判断当所述目标用户发出的语音控制指令与第二预设语音控制指令库中任意一条指令匹配时;不执行所述语音控制指令对应的操作。5.如权利要求1所述的一种结合人脸信息的语音控制方法,其特征在于,所述获取目标用户发出的语音控制指令之后,还包括:当所述目标用户发出的语音控制指令与第一预设语音控制指令库中任意一条指令不匹配时;不执行所述语音控制指令对应的操作。6.一种结合人脸信息的语音控制装置,其中包括存储器、至少一个处理器及可执行代码,所述存储器用于存储可执行代码;所述处理经配置以执行所述可执行代码,以实现如本发明权利要求1到5中所述方法。7.一种结合人脸信息的语音控制系统,其特征在于,包括摄像头、处理模块、人脸信息匹配模块、眼球数据获取模块、...

【专利技术属性】
技术研发人员:黄可斌
申请(专利权)人:广州市果豆科技有限责任公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1