语音控制方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:36875723 阅读:10 留言:0更新日期:2023-03-15 20:33
本公开公开了一种语音控制方法、装置、电子设备及计算机可读存储介质,涉及计算机技术领域,尤其涉及自动驾驶技术领域。具体实现方案为:在显示有目标界面的情况下,接收语音控制指令;响应于所述语音控制指令,获取所述语音控制指令的自动语音识别结果;在预设词库中确定所述自动语音识别结果对应的文本内容;其中,所述预设词库由对每个界面的每个功能控件对应的控件信息进行泛化处理得到,所述界面为多个且包括所述目标界面,所述控件信息包括每个所述功能控件的文字描述信息;确定所述文本内容对应的目标功能控件;基于所述目标功能控件执行所述语音控制指令。采用本公开实施例,可以提供一种人力消耗较低,控制效率较高的语音控制方法。音控制方法。音控制方法。

【技术实现步骤摘要】
语音控制方法、装置、电子设备及计算机可读存储介质


[0001]本公开涉及计算机
,尤其涉及自动驾驶
,具体涉及 一种语音控制方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]相关技术中,语音控制在车载场景的应用越来越广泛。示例性的,在 使用语音控制之前,APP(application),应用程序)开发人员需要将支持 语音控制的第三方APP的功能元素注册至语音引擎,并将每个功能元素与 对应的功能实现接口关联,以使用户进行语音控制时,车机系统可以将用 户的语音控制指令发送至对应的APP,由该APP调用对应的功能实现接 口,实现某APP某功能控件的语音控制。

技术实现思路

[0003]本公开提供了一种语音控制方法、装置、电子设备及计算机可读存储 介质。
[0004]根据本公开的一方面,提供了一种语音控制方法,包括:
[0005]在显示有目标界面的情况下,接收语音控制指令;
[0006]响应于所述语音控制指令,获取所述语音控制指令的自动语音识别结 果;
[0007]在预设词库中确定所述自动语音识别结果对应的文本内容;其中,所 述预设词库由对每个界面的每个功能控件对应的控件信息进行泛化处理 得到,所述界面为多个且包括所述目标界面,所述控件信息包括每个所述 功能控件的文字描述信息;
[0008]确定所述文本内容对应的目标功能控件;
[0009]基于所述目标功能控件执行所述语音控制指令。
[0010]根据本公开的另一方面,提供了一种语音控制装置,包括:
[0011]指令接收模块,用于在显示有目标界面的情况下,接收语音控制指令;
[0012]第一获取模块,用于响应于所述语音控制指令,获取所述语音控制指 令的自动语音识别结果;
[0013]第一确定模块,用于在预设词库中确定所述自动语音识别结果对应的 文本内容;其中,所述预设词库由对每个界面的每个功能控件对应的控件 信息进行泛化处理得到,所述界面为多个且包括所述目标界面,所述控件 信息包括每个所述功能控件的文字描述信息;
[0014]第二确定模块,用于确定所述文本内容对应的目标功能控件;
[0015]执行模块,用于基于所述目标功能控件执行所述语音控制指令。
[0016]根据本公开的另一方面,提供了一种电子设备,包括:
[0017]至少一个处理器;以及
[0018]与所述至少一个处理器通信连接的存储器;其中,
[0019]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被 所述至少一个处理器执行,以使所述至少一个处理器能够执行如一方面中 任一项所述的方法。
[0020]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算 机可读存储介质,其中,所述计算机指令用于使所述计算机执行如一方面 中任一项所述的方法。
[0021]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程 序/指令,所述计算机程序/指令在被处理器执行时实现根据权利要求1

11 中任一项所述的方法中的步骤。
[0022]本公开的有益效果:
[0023]在本公开的实施例中,通过在显示有目标界面的情况下,接收语音控 制指令;响应于语音控制指令,获取语音控制指令的自动语音识别结果; 在预设词库中确定自动语音识别结果对应的文本内容;确定文本内容对应 的目标功能控件;基于目标功能控件执行语音控制指令。这样,可以提供 一种人力消耗较低,控制效率较高的语音控制方法。
[0024]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键 或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下 的说明书而变得容易理解。
附图说明
[0025]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0026]图1是根据本公开第一实施例的语音控制方法的流程示意图;
[0027]图2是根据本公开第二实施例的语音控制方法的流程示意图;
[0028]图3是根据本公开第二实施例的确定目标功能控件的流程示意图;
[0029]图4是根据本公开第一实施例的语音控制装置的流程示意图;
[0030]图5是用来实现本公开实施例的语音控制方法的电子设备的框图。
具体实施方式
[0031]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实 施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本 领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和 修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的 描述中省略了对公知功能和结构的描述。
[0032]本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、 加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背 公序良俗。
[0033]下面参照附图描述根据本公开实施例提出的语音控制方法、装置、电 子设备及计算机可读存储介质,首先将参照附图描述根据本公开实施例提 出的语音控制方法。
[0034]图1是根据本公开实施例的语音控制方法的流程图,应用于车机系统, 例如可以由车机系统的控制器执行。如图1所示,本公开实施例的语音控 制方法,可以包括:
[0035]步骤S110,在显示有目标界面的情况下,接收语音控制指令。
[0036]在本公开的实施例中,用户在想要语音控制某个APP的某个功能控 件时,可以向车机系统输入语音控制指令。示例性的,用户可以在车机系 统启动后,车机系统的中控显示屏显示有某界面(即目标界面)的情况下, 以语音说话的方式说出想要执行的语音控制指令,使得车载麦克风可以接 收到用户的语音控制指令,并可以将该语音控制指令传输至车机系统,以 使车机系统可以在显示有目标界面的情况下,接收到语音控制指令。可以 理
解的,目标界面可以是第三方APP的界面、系统桌面界面、系统APP 的界面等。
[0037]步骤S120,响应于语音控制指令,获取语音控制指令的自动语音识 别结果。
[0038]在本公开的实施例中,在接收语音控制指令之后,可以获取语音控制 指令的自动语音识别结果。示例性的,可以通过语音识别引擎对语音控制 指令进行语音识别,例如语音识别引擎可以通过ASR(Automatic SpeechRecognition,自动语音识别)技术对语音控制指令进行语音识别,以获取 到语音控制指令的具体语音识别的ASR结果,即自动语音识别结果。
[0039]步骤S130,在预设词库中确定自动语音识别结果对应的文本内容。
[0040]其中,预设词库可以预先由对每个界面的每个功能控件对应的控件信 息进行泛化处理得到,界面为多个且包括目标界面,控件信息包括每个功 能控件的文字描述信息。其中,界面可以包括任一第三方APP的界面、桌 面界面、系统APP的界面等,前述多个界面例如可以包括车机系统中所有 本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音控制方法,包括:在显示有目标界面的情况下,接收语音控制指令;响应于所述语音控制指令,获取所述语音控制指令的自动语音识别结果;在预设词库中确定所述自动语音识别结果对应的文本内容;其中,所述预设词库由对每个界面的每个功能控件对应的控件信息进行泛化处理得到,所述界面为多个且包括所述目标界面,所述控件信息包括每个所述功能控件的文字描述信息;确定所述文本内容对应的目标功能控件;基于所述目标功能控件执行所述语音控制指令。2.根据权利要求1所述的方法,所述在显示有目标界面的情况下,接收语音控制指令之前,还包括:获取每个所述界面中的至少一个功能控件;获取每个所述界面中的每个所述功能控件对应的控件信息;其中,所述控件信息包括功能控件对应的根功能控件的控件信息、所述根功能控件信息的至少一个子功能控件的控件信息;按照预设泛化规则基于每个所述功能控件的文字描述信息,生成所述预设词库。3.根据权利要求2所述的方法,其中,所述按照预设泛化规则基于每个所述功能控件的文字描述信息,生成所述预设词库,包括:基于第一预设词槽和第二预设词槽,对每个所述功能控件的文字描述信息进行泛化处理,得到所述预设词库;其中,所述第一预设词槽用于指示对所述功能控件的文字描述信息的具体执行动作,所述第二预设词槽用于指示对所述功能控件的文字描述信息的具体执行内容。4.根据权利要求2所述的方法,其中,所述控件信息还包括用于指示所述功能控件是否可操作的信息。5.根据权利要求4所述的方法,其中,所述确定所述文本内容对应的目标功能控件,包括:确定所述文本内容对应的第一功能控件;获取所述第一功能控件对应的第一控件信息;根据所述第一控件信息确定所述第一功能控件是否可操作;响应于所述第一功能控件可操作,将所述第一功能控件确定为所述文本内容对应的目标功能控件。6.根据权利要求5所述的方法,所述方法还包括:响应于所述第一功能控件不可操作,确定所述第一功能控件的第一父功能控件是否可操作;响应于所述第一父功能控件可操作,将所述第一父功能控件确定为所述文本内容对应的目标功能控件。7.根据权利要求6所述的方法,所述方法还包括:响应于所述第一父功能控件不可操作,确定所述第一父功能控件的第二父功能控件是否可操作;响应于所述第二父功能控件可操作,将所述第二父功能控件确定为所述文本内容对应
的目标功能控件;响应于所述第二父功能控件不可操作,按照预设遍历方式遍历确定所述第二父功能控件的父功能控件是否存在可操作的父功能控件;其中,所述预设遍历方式包括按照功能控件的树状结构从小到大的顺序依次遍历每个功能控件的父功能控件,直至遍历至根功能控件;响应于所述第二父功能控件的父功能控件存在可操作的父功能控件,将所述第二父功能控件的父功能控件中最小且可操作的父功能控件确定为所述文本内容对应的目标功能控件。8.根据权利要求7所述的方法,所述控件信息还包括所述功能控件的位置信息。9.根据权利要求8所述的方法,所述方法还包括:响应于所述第二父功能控件的父功能控件不存在可操作的父功能控件,获取所述第一功能控件的位置信息;将所述目标界面中与所述第一功能控件的位置信息的距离最近的功能控件,确定为所述文本内容对应的目标功能控件。10.根据权利要求9所述的方法,其中,所述将所述目标界面中与所述第一功能控件的位置信息的距离最近的功能控件,确定为所述文本内容对应的目标功能控件,包括:确定所述目标界面中在所述第一功能控件的预设方向与所述第一功能控件的位置信息的距离最近的第二功能控件;其中,所述预设方向为至少一个;获取每个所述第二功能控件对应的控件信息;根据每个所述第二功能控件对应的控件信息中用于指示功能控件是否可操作的信息,确定所述第二功能控件中可操作的第三功能控件;响应于所述第三功能控件的数量为1,将所述第三功能控件确定为所述文本内容对应的目标功能控件。11.根据权利要求10所述的方法,所述方法还包括:响应于所述第三功能控件的数量大于1,将第三功能控件中与所述第一功能控件的位置信息的距离最近的所述第三功能控件,确定为所述文本内容对应的目标功能控件。12.一种语音控制装置,包括:指令接收模块,用于在显示有目标界面的情况下,接收语音控制指令;第一获取模块,用于响应于所述语音控制指令,获取所述语音控制指令的自动语音识别结果;第一确定模块,用于在预设词库中确定所述自动语音识别结果对应的文本内容;其中,所述预设词库由对每个界面的每个功能控件对应的控件信息进行泛化处理得到,所述界面为多个且包括所述目标界面,所述控件信息包括每个所述功能控件...

【专利技术属性】
技术研发人员:周文欢
申请(专利权)人:阿波罗智联北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1