语音控制设备的方法及电子设备技术

技术编号:35137103 阅读:40 留言:0更新日期:2022-10-05 10:12
本申请提供了一种应用于人工智能领域的语音控制设备的方法、电子设备。语音控制设备的方法,包括:获取用户的语音指令,所述语音指令用于指示目标指令;获取当前用户界面的用户界面信息,所述当前用户界面为客户端设备当前显示的用户界面;确定所述语音指令所对应的所述目标指令,所述目标指令是由所述语音指令以及所述用户界面信息得到。本申请提供的语音控制设备的方法及电子设备,有利于提高语音识别的效率。的效率。的效率。

【技术实现步骤摘要】
语音控制设备的方法及电子设备
[0001]本申请是分案申请,原申请的申请号是202010273843.4,原申请日是2020年04月09日,原申请的全部内容通过引用结合在本申请中。


[0002]本申请涉及人工智能领域以及电子设备领域,并且更具体地,涉及一种语音控制设备的方法及电子设备。

技术介绍

[0003]用户可以通过大屏显示装置观看电视直播、网络视频资源、本地视频资源,并收听网络音频资源、本地音频资源等。在用户观看视频或收听音乐之前,用户可以根据大屏显示装置显示的用户界面,说出想要播放的视音频资源;大屏显示装置或与大屏显示装置连接的机顶盒可以捕获并响应用户的语音。
[0004]为保证语音识别的准确性和高效性,通常为大屏显示装置配置了用于语音识别的文件,该语音识别文件可以用于识别调取大屏显示装置上配置的数据资源的语音指令。为获得相对优良的用户体验感,需要经常更新在大屏显示装置上显示或播放的数据资源。例如,大屏显示装置可以播放最新上映的电视剧。相应地,需要耗费较大的工作量来在大屏显示装置上更新语音识别文件。这可能会降低语音识别的效率。

技术实现思路

[0005]本申请提供一种语音控制设备的方法及电子设备,其目的在于提高语音识别的效率。
[0006]第一方面,提供了一种语音控制设备的方法,包括:获取用户的语音指令,所述语音指令用于指示目标指令;获取当前用户界面的用户界面信息,所述当前用户界面为客户端设备当前显示的用户界面;确定所述语音指令所对应的所述目标指令,所述目标指令是由所述语音指令以及所述用户界面信息得到。
[0007]可选的,所述语音控制设备的方法可以由客户端设备(又可以被称为终端设备)或服务器(又可以被称为网络设备)完成。
[0008]可选的,所述语音控制设备的方法可以由客户端设备上的语音助手完成。
[0009]用户界面信息可以包括指示当前用户界面的各种信息。
[0010]在本申请中,与客户端设备能够显示、播放的数据资源相比,当前用户界面上的信息内容相对较少,获取用户界面信息的时间可以相对较短。并且,客户端设备在显示用户界面信息的同时,还可以获取至少部分用户界面信息,因此获取用户界面信息的效率可以相对较高。然后,在更新客户端设备的用户显示界面的同时,还可以将用户界面信息更新,更新的方式相对简便。在当前用户界面被更新的情况下,由于客户端设备在显示该更新后的用户界面时就已经获知了该更新后的用户界面的至少部分用户界面信息,因此当前用户界面的更新对语音识别效率的影响通常相对较小。另外,用户界面信息可以反映用户在当前
用户界面上可以观察到的信息,参考用户界面信息识别用户的语音指令,有利于提升语音识别的正确率。
[0011]结合第一方面,在第一方面的某些实现方式中,所述用户界面信息包括以下至少一种信息:所述当前用户界面的图标名称、热词信息、操控指令的指示信息、目标角标信息。
[0012]图标可以被分类为菜单图标、资源合集图标、功能图标等。
[0013]在本申请中,用户界面信息可以从多个角度反映用户界面上的内容,以便于用户使用多种方式操控客户端设备。
[0014]结合第一方面,在第一方面的某些实现方式中,所述目标角标信息与目标图标或目标操控指令对应。
[0015]可选的,所述用户界面信息还包括所述目标角标信息与目标图标之间的对应关系。
[0016]可选的,所述用户界面信息还包括所述目标角标信息与目标合集之间的对应关系。
[0017]可选的,所述用户界面信息还包括所述目标角标信息与目标操控指令之间的对应关系。
[0018]在本申请中,通过在当前用户界面上显示角标,有利于增加可识别的语音指令数量,有利于提升语音识别的正确率。例如,在用户无法用语言描述图案的情况下,用户可以根据角标反映的信息,相对快速地表述语音指令。
[0019]结合第一方面,在第一方面的某些实现方式中,所述获取用户的语音指令,包括:接收所述客户端设备发送的所述语音指令;所述获取当前用户界面的用户界面信息,包括:接收所述客户端设备发送的所述用户界面信息;所述确定所述语音指令所对应的目标指令,包括:根据所述语音指令以及所述用户界面信息,确定所述目标指令。
[0020]服务器例如可以通过语音识别(automatic speech recognition,ASR)模块、语义理解(natural language understanding,NLU)模块实现语音识别的操作。可选的,服务器或客户端设备还可以包括对话控制(dialogue state tracking,DST)模块、对话管理(dialogue manager,DM)模块、对话生成(natural language generation,NLG)模块和语音播报(text to speech,TTS)模块等实现语音识别的操作。
[0021]在本申请中,服务器在获取用户界面信息之后,可以参考客户端当前显示的内容,识别用户做出的语音指令,有利于服务器排除无用的语音识别数据,相对快速、准确地将用户的语音指令转换为对应的目标指令。
[0022]结合第一方面,在第一方面的某些实现方式中,所述方法还包括:将所述目标指令发送给所述客户端设备。
[0023]在本申请中,使用服务器识别语音指令,并通过通信网络进行数据传送,可以降低对客户端设备的处理能力的要求。例如客户端设备可以不具有语音识别能力,或者客户端设备的处理器速度、存储器容量可以相对普通。
[0024]结合第一方面,在第一方面的某些实现方式中,所述确定所述语音指令所对应的目标指令,包括:所述客户端设备根据所述语音指令以及所述用户界面信息,确定所述目标指令。
[0025]在本申请中,客户端设备可以具备语音识别的能力。由于用户界面信息缩小了语
音识别的参考数据量,因此有利于提升客户端设备的语音识别效果。
[0026]结合第一方面,在第一方面的某些实现方式中,在所述确定所述语音指令所对应的目标指令之前,所述方法还包括:将所述用户界面信息以及所述语音指令发送给服务器;所述确定所述语音指令所对应的目标指令,包括:接收所述服务器发送的目标指令,所述目标指令由所述服务器根据所述用户界面信息以及所述用户的语音指令确定。
[0027]在本申请中,服务器在获取用户界面信息之后,可以参考客户端当前显示的内容,识别用户做出的语音指令,有利于服务器排除无用的语音识别数据,相对快速、准确地将用户的语音指令转换为对应的目标指令。另外,使用服务器识别语音指令,并通过通信网络进行数据传送,可以降低对客户端设备的处理能力的要求。例如客户端设备可以不具有语音识别能力,或者客户端设备的处理器速度、存储器容量可以相对普通。
[0028]结合第一方面,在第一方面的某些实现方式中,在所述获取当前用户界面的用户界面信息之前,所述方法还包括:向前台应用发送第一指示信息,所述第一指示信息用于指示所述前台应用反馈所述用户界面信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音控制设备的方法,所述方法应用于终端设备,其特征在于,包括:显示第一用户界面,所述第一用户界面包括多个元素;在所述第一用户界面上显示角标,所述角标包括与所述多个元素中的第一元素对应的第一角标;获取用户的第一语音指令,所述第一语音指令包括用于指示所述第一角标的信息;在获取所述第一语音指令后,去除所述第一用户界面上显示的角标;根据所述第一语音指令执行所述第一元素对应的操作。2.根据权利要求1所述的方法,其特征在于,所述在所述第一用户界面上显示角标包括:在唤醒所述终端设备的语音助手后在所述第一用户界面上显示所述角标。3.根据权利要求2所述的方法,其特征在于,所述语音助手是通过唤醒词唤醒的。4.根据权利要求2或3所述的方法,其特征在于,所述终端设备的语音助手执行如下操作:在被唤醒后,指示所述终端设备的前台应用在所述前台应用当前显示的所述第一用户界面上显示角标;获取用户的所述第一语音指令;指示所述前台应用去除所述第一用户界面上显示的角标;所述前台应用执行如下操作:显示所述第一用户界面;根据所述语音助手的指示在所述第一用户界面上显示角标;根据所述语音助手的指示去除所述第一用户界面上显示的角标。5.根据权利要求1

3任一所述的方法,其特征在于,所述根据所述第一语音指令执行所述第一元素对应的操作包括:确定所述第一语音指令所对应的第一目标指令,所述第一目标指令用于指示执行所述第一元素对应的操作;根据所述第一目标指令执行所述第一元素对应的操作。6.根据权利要求5所述的方法,其特征在于,所述终端设备上运行的语音助手执行如下操作:获取用户的所述第一语音指令;确定所述第一语音指令所对应的所述第一目标指令;向所述终端设备的前台应用发送所述第一目标指令;所述前台应用执行如下操作:显示所述第一用户界面;在所述第一用户界面上显示所述角标;接收所述语音助手发送的所述第一目标指令;根据所述第一目标指令执行所述第一元素对应的操作;去除所述第一用户界面上显示的角标。7.根据权利要求5所述的方法,其特征在于,所述根据所述第一语音指令执行所述第一元素对应的操作之前,所述方法还包括:获取所述第一用户界面的用户界面信息,所述用户界面信息包括目标角标信息,所述目标角标信息用于指示所述第一用户界面的角标;所述
第一目标指令是由所述第一语音指令以及所述用户界面信息得到。8.根据权利要求7所述的方法,其特征在于,所述目标角标信息与所述第一用户界面的目标图标对应。9.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取用户的第二语音指令,所述第二语音指令包括用于指示目标热词的信息,所述目标热词与所述多个元素中的第二元素对应;根据所述第二语音指令执行所述第二元素对应的操作。10.根据权利要求9所述的方法,其特征在于,所述目标热词没有显示在所述第一用户界面上。11.根据权利要求9或10所述的方法,其特征在于,所述根据所述第二语音指令执行所述第二元素对应的操作包括:确定所述第二语音指令所对应的第二目标指令,所述第二目标指令用于指示执行所述第二元素对应的操作;根据所述第二目标指令执行所述第二元素对应的操作。12.根据权利要求11所述的方法,其特征在于,所述根据所述第二语音指令执行所述第二元素对应的操作之前,所述方法还包括:获取所述第一用户界面的用户界面信息,所述用户界面信息包括热词信息,所述热词信息包括所述目标热词;所述确定所述第二语音指令所对应的第二目标指令包括:根据所述第二语音指令以及所述用户界面信息确定所述第二目标指令。13.根据权利要求7所述的方法,其特征在于,所述用户界面信息还包括以下至少一种信息:所述第一用户界面的图标名称、热词信息、操控指令的指示信息。14.根据权利要求7所述的方法,其特征在于,在所述确定所述第一语音指令所对应的目标指令之前,所述方法还包括:将所述用户界面信息以及所述第一语音指令发送给服务器;所述确定所述第一语音指令所对应的第一目标指令,包括:接收所述服务器发送的第一目标指令,所述第一目标指令由所述服务器根据所述用户界面信息以及所述第一语音指令确定。15.根据权利要求7所述的方法,其特征在于,所述确定所述第一语音指令所对应的第一目标指令,包括:根据所述第一语音指令以及所述用户界面信息,确定所述第一目标指令。16.根据权利要求7所述的方法,其特征在于,所述终端设备上运行的语音助手执行如下操作:获取所述第一用户界面的用户界面信息;获取用户的所述第一语音指令;确定所述第一语音指令所对应的所述第一目标指令;向所述终端设备的前台应用发送所述第一目标指令;所述前台应用执行如下操作:显示所述第一用户界面;在所述第一用户界面上显示所...

【专利技术属性】
技术研发人员:吴友国张桂成杨鋆源金伟明陈闽江
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1