语音控制设备的方法及电子设备技术

技术编号:27306726 阅读:20 留言:0更新日期:2021-02-10 09:21
本申请提供了一种应用于人工智能领域的语音控制设备的方法、电子设备。语音控制设备的方法,包括:获取用户的语音指令,所述语音指令用于指示目标指令;获取当前用户界面的用户界面信息,所述当前用户界面为客户端设备当前显示的用户界面;确定所述语音指令所对应的所述目标指令,所述目标指令是由所述语音指令以及所述用户界面信息得到。本申请提供的语音控制设备的方法及电子设备,有利于提高语音识别的效率。的效率。的效率。

【技术实现步骤摘要】
语音控制设备的方法及电子设备


[0001]本申请涉及人工智能领域以及电子设备领域,并且更具体地,涉及一种语音控制设备的方法及电子设备。

技术介绍

[0002]用户可以通过大屏显示装置观看电视直播、网络视频资源、本地视频资源,并收听网络音频资源、本地音频资源等。在用户观看视频或收听音乐之前,用户可以根据大屏显示装置显示的用户界面,说出想要播放的视音频资源;大屏显示装置或与大屏显示装置连接的机顶盒可以捕获并响应用户的语音。
[0003]为保证语音识别的准确性和高效性,通常为大屏显示装置配置了用于语音识别的文件,该语音识别文件可以用于识别调取大屏显示装置上配置的数据资源的语音指令。为获得相对优良的用户体验感,需要经常更新在大屏显示装置上显示或播放的数据资源。例如,大屏显示装置可以播放最新上映的电视剧。相应地,需要耗费较大的工作量来在大屏显示装置上更新语音识别文件。这可能会降低语音识别的效率。

技术实现思路

[0004]本申请提供一种语音控制设备的方法及电子设备,其目的在于提高语音识别的效率。
[0005]第一方面,提供了一种语音控制设备的方法,包括:获取用户的语音指令,所述语音指令用于指示目标指令;获取当前用户界面的用户界面信息,所述当前用户界面为客户端设备当前显示的用户界面;确定所述语音指令所对应的所述目标指令,所述目标指令是由所述语音指令以及所述用户界面信息得到。
[0006]可选的,所述语音控制设备的方法可以由客户端设备(又可以被称为终端设备)或服务器(又可以被称为网络设备)完成。
[0007]可选的,所述语音控制设备的方法可以由客户端设备上的语音助手完成。
[0008]用户界面信息可以包括指示当前用户界面的各种信息。
[0009]在本申请中,与客户端设备能够显示、播放的数据资源相比,当前用户界面上的信息内容相对较少,获取用户界面信息的时间可以相对较短。并且,客户端设备在显示用户界面信息的同时,还可以获取至少部分用户界面信息,因此获取用户界面信息的效率可以相对较高。然后,在更新客户端设备的用户显示界面的同时,还可以将用户界面信息更新,更新的方式相对简便。在当前用户界面被更新的情况下,由于客户端设备在显示该更新后的用户界面时就已经获知了该更新后的用户界面的至少部分用户界面信息,因此当前用户界面的更新对语音识别效率的影响通常相对较小。另外,用户界面信息可以反映用户在当前用户界面上可以观察到的信息,参考用户界面信息识别用户的语音指令,有利于提升语音识别的正确率。
[0010]结合第一方面,在第一方面的某些实现方式中,所述用户界面信息包括以下至少
一种信息:所述当前用户界面的图标名称、热词信息、操控指令的指示信息、目标角标信息。
[0011]图标可以被分类为菜单图标、资源合集图标、功能图标等。
[0012]在本申请中,用户界面信息可以从多个角度反映用户界面上的内容,以便于用户使用多种方式操控客户端设备。
[0013]结合第一方面,在第一方面的某些实现方式中,所述目标角标信息与目标图标或目标操控指令对应。
[0014]可选的,所述用户界面信息还包括所述目标角标信息与目标图标之间的对应关系。
[0015]可选的,所述用户界面信息还包括所述目标角标信息与目标合集之间的对应关系。
[0016]可选的,所述用户界面信息还包括所述目标角标信息与目标操控指令之间的对应关系。
[0017]在本申请中,通过在当前用户界面上显示角标,有利于增加可识别的语音指令数量,有利于提升语音识别的正确率。例如,在用户无法用语言描述图案的情况下,用户可以根据角标反映的信息,相对快速地表述语音指令。
[0018]结合第一方面,在第一方面的某些实现方式中,所述获取用户的语音指令,包括:接收所述客户端设备发送的所述语音指令;所述获取当前用户界面的用户界面信息,包括:接收所述客户端设备发送的所述用户界面信息;所述确定所述语音指令所对应的目标指令,包括:根据所述语音指令以及所述用户界面信息,确定所述目标指令。
[0019]服务器例如可以通过语音识别(automatic speech recognition,ASR)模块、语义理解(natural language understanding,NLU)模块实现语音识别的操作。可选的,服务器或客户端设备还可以包括对话控制(dialogue state tracking,DST)模块、对话管理(dialogue manager,DM)模块、对话生成(natural language generation,NLG)模块和语音播报(text to speech,TTS)模块等实现语音识别的操作。
[0020]在本申请中,服务器在获取用户界面信息之后,可以参考客户端当前显示的内容,识别用户做出的语音指令,有利于服务器排除无用的语音识别数据,相对快速、准确地将用户的语音指令转换为对应的目标指令。
[0021]结合第一方面,在第一方面的某些实现方式中,所述方法还包括:将所述目标指令发送给所述客户端设备。
[0022]在本申请中,使用服务器识别语音指令,并通过通信网络进行数据传送,可以降低对客户端设备的处理能力的要求。例如客户端设备可以不具有语音识别能力,或者客户端设备的处理器速度、存储器容量可以相对普通。
[0023]结合第一方面,在第一方面的某些实现方式中,所述确定所述语音指令所对应的目标指令,包括:所述客户端设备根据所述语音指令以及所述用户界面信息,确定所述目标指令。
[0024]在本申请中,客户端设备可以具备语音识别的能力。由于用户界面信息缩小了语音识别的参考数据量,因此有利于提升客户端设备的语音识别效果。
[0025]结合第一方面,在第一方面的某些实现方式中,在所述确定所述语音指令所对应的目标指令之前,所述方法还包括:将所述用户界面信息以及所述语音指令发送给服务器;
所述确定所述语音指令所对应的目标指令,包括:接收所述服务器发送的目标指令,所述目标指令由所述服务器根据所述用户界面信息以及所述用户的语音指令确定。
[0026]在本申请中,服务器在获取用户界面信息之后,可以参考客户端当前显示的内容,识别用户做出的语音指令,有利于服务器排除无用的语音识别数据,相对快速、准确地将用户的语音指令转换为对应的目标指令。另外,使用服务器识别语音指令,并通过通信网络进行数据传送,可以降低对客户端设备的处理能力的要求。例如客户端设备可以不具有语音识别能力,或者客户端设备的处理器速度、存储器容量可以相对普通。
[0027]结合第一方面,在第一方面的某些实现方式中,在所述获取当前用户界面的用户界面信息之前,所述方法还包括:向前台应用发送第一指示信息,所述第一指示信息用于指示所述前台应用反馈所述用户界面信息;所述获取当前用户界面的用户界面信息,包括:接收所述前台应用发送的所述用户界面信息,所述用户界面信息由所述前台应用检索与所述当前用户界面相关的信息得到。...

【技术保护点】

【技术特征摘要】
1.一种语音控制设备的方法,其特征在于,包括:获取用户的语音指令,所述语音指令用于指示目标指令;获取当前用户界面的用户界面信息,所述当前用户界面为客户端设备当前显示的用户界面;确定所述语音指令所对应的所述目标指令,所述目标指令是由所述语音指令以及所述用户界面信息得到。2.根据权利要求1所述的方法,其特征在于,所述用户界面信息包括以下至少一种信息:所述当前用户界面的图标名称、热词信息、操控指令的指示信息、目标角标信息。3.根据权利要求2所述的方法,其特征在于,所述目标角标信息与目标图标或目标操控指令对应。4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述确定所述语音指令所对应的目标指令之前,所述方法还包括:将所述用户界面信息以及所述语音指令发送给服务器;所述确定所述语音指令所对应的目标指令,包括:接收所述服务器发送的目标指令,所述目标指令由所述服务器根据所述用户界面信息以及所述用户的语音指令确定。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述确定所述语音指令所对应的目标指令,包括:所述客户端设备根据所述语音指令以及所述用户界面信息,确定所述目标指令。6.根据权利要求4或5所述的方法,其特征在于,在所述获取当前用户界面的用户界面信息之前,所述方法还包括:向前台应用发送第一指示信息,所述第一指示信息用于指示所述前台应用反馈所述用户界面信息;所述获取当前用户界面的用户界面信息,包括:接收所述前台应用发送的所述用户界面信息,所述用户界面信息由所述前台应用检索与所述当前用户界面相关的信息得到。7.根据权利要求4至6中任一项所述的方法,其特征在于,所述用户界面信息包括目标角标信息,在所述获取用户的语音指令之前,所述方法还包括:在所述当前用户界面上显示角标;在所述获取用户的语音指令之后,所述方法还包括:去除所述当前用户界面上的角标。8.根据权利要求6所述的方法,其特征在于,所述用户界面信息还包括所述前台应用的标识。9.根据权利要求8所述的方法,其特征在于,所述目标指令还包括所述前台应用的标识。10.根据权利要求1至3中任一项所述的方法,其特征在于,所述获取用户的语音指令,包括:接收所述客户端设备发送的所述语音指令;所述获取当前用户界面的用户界面信息,包括:
接收所述客户端设备发送的所述用户界面信息;所述确定所述语音指令所对应的目标指令,包括:根据所述语音指令以及所述用户界面信息,确定所述目标指令。11.根据权利要求10所述的方法,其特征在于,所述方法还包括:将所述目标指令发送给所述客户端设备。12.一种电子设备,其特征在于,包括:获取模块,用于获取用户的语音指令,所述语音指令用于指示目标指令;所述获取模块还用于,获取当前用户界面的用户界面信息,所述当前用户界面为客户端设备当前显示的用户界面;处理模块,用于确定所述语音指令所对应的所...

【专利技术属性】
技术研发人员:吴友国张桂成杨鋆源金伟明陈闽江
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1