语音控制方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26422419 阅读:17 留言:0更新日期:2020-11-20 14:18
本发明专利技术涉及一种语音控制方法、装置、电子设备及存储介质,所述方法应用于终端设备,包括:接收输入的语音控制命令,获取所述语音控制命令的识别结果;在预设搜索范围内,逐级查找与所述识别结果匹配的执行对象;根据查找结果,响应所述语音控制命令;其中,所述预设搜索范围至少包括以下任意一种:接收所述语音控制命令时所述终端设备的当前界面、接收所述语音控制命令时所述终端设备当前运行的至少一个应用程序、所述终端设备的系统。

【技术实现步骤摘要】
语音控制方法、装置、电子设备及存储介质
本专利技术涉及语音控制
,尤其涉及一种语音控制方法、装置、电子设备及存储介质。
技术介绍
随着科学技术的不断进步,用户和终端设备等机器的交互方式也在发生变化,出现了越来越多的语音助手,用于识别用户的语音控制命令并给出对应的回复及执行对应的操作,实现了用户对终端设备的语音控制。但是语音控制方式的信息获取效率和准确率均较低,导致终端设备对用户语音控制命令的响应效率低,响应准确率低。
技术实现思路
本专利技术提供一种语音控制方法、装置、电子设备及存储介质,以解决相关技术中的不足。根据本专利技术实施例的第一方面,提供一种语音控制方法,应用于终端设备,所述控制方法包括:接收输入的语音控制命令,获取所述语音控制命令的识别结果;在预设搜索范围内,逐级查找与所述识别结果匹配的执行对象;根据查找结果,响应所述语音控制命令;其中,所述预设搜索范围至少包括以下任意一种:接收所述语音控制命令时所述终端设备的当前界面、接收所述语音控制命令时所述终端设备当前运行的至少一个应用程序、所述终端设备的系统。在一个实施例中,所述逐级查找与所述识别结果匹配的执行对象,包括:按照预设的优先级顺序在所述预设搜索范围内查找与所述识别结果匹配的所述执行对象,并在确定所述执行对象后停止查找。在一个实施例中,所述预设的优先级顺序为:接收所述语音控制命令时终端设备的当前界面、接收所述语音控制命令时终端设备当前运行的至少一个应用程序和终端设备的系统的优先级依次降低。在一个实施例中,所述识别结果包括用于指示所述语音控制命令的执行对象的第一语义信息;当预设搜索范围包括接收所述语音控制命令时终端设备的当前界面,所述查找与所述识别结果匹配的执行对象,包括:获得对所述显示界面进行分割所得到的多个界面元素;确定至少一个界面元素的目标信息,其中,所述目标信息包括所述界面元素的第二语义信息;分别比较至少一个所述界面元素的第二语义信息和所述第一语义信息,若任一所述界面元素的第二语义信息与所述第一语义信息相匹配,则确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象。在一个实施例中,所述目标信息还包括所述界面元素的位置信息;所述确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象,包括:获取与所述第一语义信息相匹配的第二语义信息对应的界面元素;根据获取的所述界面元素的所述位置信息,确定在所述显示界面的对应位置的所述界面元素为所述执行对象。在一个实施例中,所述识别结果还包括用于确定所述语音控制命令的控制内容的第三语义信息;所述根据查找结果,响应所述语音控制命令,包括:对所述执行对象执行与所述第三语义信息对应的操作。在一个实施例中,所述识别结果包括意图信息;当预设搜索范围包括接收所述语音控制命令时终端设备当前运行的至少一个应用程序和/或终端设备的系统,所述查找与所述识别结果匹配的执行对象,包括:根据所述意图信息和应用程序支持的操作类型确定所述执行对象。在一个实施例中,当预设搜索范围为接收所述语音控制命令时终端设备当前运行的至少一个应用程序,所述查找与所述识别结果匹配的执行对象,包括:获取终端设备当前运行的每个应用程序支持的至少一种操作类型对应的第四语义信息;分别比较至少一个操作类型对应的第四语义信息与所述意图信息,若任一操作类型对应的第四语义信息与所述意图信息相匹配,则确定与所述意图信息匹配的第四语义信息对应的操作类型所属的应用程序为所述执行对象。在一个实施例中,当预设搜索范围为终端设备的系统,所述查找与所述识别结果匹配的执行对象,包括:获取所述系统的操作类型响应表中至少一个操作类型对应的第五语义信息,其中,所述操作类型响应表包括操作类型与响应程序的映射关系;分别比较至少一个操作类型对应的第五语义信息与所述意图信息,若任一操作类型对应的第五语义信息与所述意图信息相匹配,则根据与所述意图信息匹配的第五语义信息对应的操作类型和所述操作类型响应表确定所述执行对象。在一个实施例中,所述识别结果还包括与所述意图信息对应的槽位信息以及各个槽位信息内的实体信息;所述根据查找结果,响应所述语音控制命令,包括:根据所述槽位信息以及各个槽位信息内的实体信息对所述执行对象执行对应的操作。在一个实施例中,所述根据查找结果,响应所述语音控制命令,还包括:响应于未确定所述执行对象,生成提示信息,其中,所述提示信息用于指示所述终端设备无法执行所述语音控制命令。根据本专利技术实施例的第二方面,提供一种语音控制装置,应用于终端设备,所述控制装置包括:识别模块,用于接收输入的语音控制命令,获取所述语音控制命令的识别结果;查找模块,用于在预设搜索范围内,逐级查找与所述识别结果匹配的执行对象;响应模块,用于根据查找结果,响应所述语音控制命令;其中,所述预设搜索范围至少包括以下任意一种:接收所述语音控制命令时所述终端设备的当前界面、接收所述语音控制命令时所述终端设备当前运行的至少一个应用程序、所述终端设备的系统。在一个实施例中,所述查找模块具体用于:按照预设的优先级顺序在所述预设搜索范围内查找与所述识别结果匹配的所述执行对象,并在确定所述执行对象后停止查找。在一个实施例中,所述预设的优先级顺序为:接收所述语音控制命令时终端设备的当前界面、接收所述语音控制命令时终端设备当前运行的至少一个应用程序和终端设备的系统的优先级依次降低。在一个实施例中,所述识别结果包括用于指示所述语音控制命令的执行对象的第一语义信息;当预设搜索范围包括接收所述语音控制命令时终端设备的当前界面,所述查找模块具体用于:获得对所述显示界面进行分割所得到的多个界面元素;确定至少一个界面元素的目标信息,其中,所述目标信息包括所述界面元素的第二语义信息;分别比较至少一个所述界面元素的第二语义信息和所述第一语义信息,若任一所述界面元素的第二语义信息与所述第一语义信息相匹配,则确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象。在一个实施例中,所述目标信息还包括所述界面元素的位置信息;所述查找模块用于确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象时,具体用于:获取与所述第一语义信息相匹配的第二语义信息对应的界面元素;根据获取的所述界面元素的所述位置信息,确定在所述显示界面的对应位置的所述界面元素为所述执行对象。在一个实施例中,所述识别结果还包括用于确定所述语音控制命令的控制内容的第三语义信息;所述响应模块具体用于:对所述执行对象执行与所述第三语义信息对应的操作。在一个实施例中,所述识别结果包括意图信息;当预设搜本文档来自技高网...

【技术保护点】
1.一种语音控制方法,其特征在于,应用于终端设备,所述控制方法包括:/n接收输入的语音控制命令,获取所述语音控制命令的识别结果;/n在预设搜索范围内,逐级查找与所述识别结果匹配的执行对象;/n根据查找结果,响应所述语音控制命令;/n其中,所述预设搜索范围至少包括以下任意一种:接收所述语音控制命令时所述终端设备的当前界面、接收所述语音控制命令时所述终端设备当前运行的至少一个应用程序、所述终端设备的系统。/n

【技术特征摘要】
1.一种语音控制方法,其特征在于,应用于终端设备,所述控制方法包括:
接收输入的语音控制命令,获取所述语音控制命令的识别结果;
在预设搜索范围内,逐级查找与所述识别结果匹配的执行对象;
根据查找结果,响应所述语音控制命令;
其中,所述预设搜索范围至少包括以下任意一种:接收所述语音控制命令时所述终端设备的当前界面、接收所述语音控制命令时所述终端设备当前运行的至少一个应用程序、所述终端设备的系统。


2.根据权利要求1所述的语音控制方法,其特征在于,所述逐级查找与所述识别结果匹配的执行对象,包括:
按照预设的优先级顺序在所述预设搜索范围内查找与所述识别结果匹配的所述执行对象,并在确定所述执行对象后停止查找。


3.根据权利要求2所述的语音控制方法,其特征在于,所述预设的优先级顺序为:
接收所述语音控制命令时终端设备的当前界面、接收所述语音控制命令时终端设备当前运行的至少一个应用程序和终端设备的系统的优先级依次降低。


4.根据权利要求1所述的语音控制方法,其特征在于,所述识别结果包括用于指示所述语音控制命令的执行对象的第一语义信息;
当预设搜索范围包括接收所述语音控制命令时终端设备的当前界面,所述查找与所述识别结果匹配的执行对象,包括:
获得对所述显示界面进行分割所得到的多个界面元素;
确定至少一个界面元素的目标信息,其中,所述目标信息包括所述界面元素的第二语义信息;
分别比较至少一个所述界面元素的第二语义信息和所述第一语义信息,若任一所述界面元素的第二语义信息与所述第一语义信息相匹配,则确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象。


5.根据权利要求4所述的语音控制方法,其特征在于,所述目标信息还包括所述界面元素的位置信息;
所述确定与所述第一语义信息相匹配的第二语义信息对应的所述界面元素为所述执行对象,包括:
获取与所述第一语义信息相匹配的第二语义信息对应的界面元素;
根据获取的所述界面元素的所述位置信息,确定在所述显示界面的对应位置的所述界面元素为所述执行对象。


6.根据权利要求4所述的语音控制方法,其特征在于,所述识别结果还包括用于确定所述语音控制命令的控制内容的第三语义信息;
所述根据查找结果,响应所述语音控制命令,包括:
对所述执行对象执行与所述第三语义信息对应的操作。


7.根据权利要求1所述的语音控制方法,其特征在于,所述识别结果包括意图信息;
当预设搜索范围包括接收所述语音控制命令时终端设备当前运行的至少一个应用程序和/或终端设备的系统,所述查找与所述识别结果匹配的执行对象,包括:
根据所述意图信息和应用程序支持的操作类型确定所述执行对象。


8.根据权利要求7所述的语音控制方法,其特征在于,当预设搜索范围为接收所述语音控制命令时终端设备当前运行的至少一个应用程序,所述查找与所述识别结果匹配的执行对象,包括:
获取终端设备当前运行的每个应用程序支持的至少一种操作类型对应的第四语义信息;
分别比较至少一个操作类型对应的第四语义信息与所述意图信息,若任一操作类型对应的第四语义信息与所述意图信息相匹配,则确定与所述意图信息匹配的第四语义信息对应的操作类型所属的应用程序为所述执行对象。


9.根据权利要求7所述的语音控制方法,其特征在于,当预设搜索范围为终端设备的系统,所述查找与所述识别结果匹配的执行对象,包括:
获取所述系统的操作类型响应表中至少一个操作类型对应的第五语义信息,其中,所述操作类型响应表包括操作类型与响应程序的映射关系;
分别比较至少一个操作类型对应的第五语义信息与所述意图信息,若任一操作类型对应的第五语义信息与所述意图信息相匹配,则根据与所述意图信息匹配的第五语义信息对应的操作类型和所述操作类型响应表确定所述执行对象。


10.根据权利要求7所述的语音控制方法,其特征在于,所述识别结果还包括与所述意图信息对应的槽位信息以及各个槽位信息内的实体信息;
所述根据查找结果,响应所述语音控制命令,包括:
根据所述槽位信息以及各个槽位信息内的实体信息对所述执行对象执行对应的操作。


11.根据权利要求6或10所述的语音控制方法,其特征在于,所述根据查找结果,响应所述语音控制命令,还包括:
响应于未确定所述执行对象,生成提示信息,其中,所述提示信息用于指示所述终端设备无法执行所述语音控制命令。


12.一种语音控制装置,其特征在于,应用于终端设备,所述控制装置包括:
识别模块,用于接收输入的语音控制命令,获取所述语...

【专利技术属性】
技术研发人员:赖永永方彦彬
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1