语音控制方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：36875723 阅读：10 留言：0更新日期：2023-03-15 20:33

本公开公开了一种语音控制方法、装置、电子设备及计算机可读存储介质，涉及计算机技术领域，尤其涉及自动驾驶技术领域。具体实现方案为：在显示有目标界面的情况下，接收语音控制指令；响应于所述语音控制指令，获取所述语音控制指令的自动语音识别结果；在预设词库中确定所述自动语音识别结果对应的文本内容；其中，所述预设词库由对每个界面的每个功能控件对应的控件信息进行泛化处理得到，所述界面为多个且包括所述目标界面，所述控件信息包括每个所述功能控件的文字描述信息；确定所述文本内容对应的目标功能控件；基于所述目标功能控件执行所述语音控制指令。采用本公开实施例，可以提供一种人力消耗较低，控制效率较高的语音控制方法。音控制方法。音控制方法。

全部详细技术资料下载

【技术实现步骤摘要】
语音控制方法、装置、电子设备及计算机可读存储介质

[0001]本公开涉及计算机
，尤其涉及自动驾驶
，具体涉及一种语音控制方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]相关技术中，语音控制在车载场景的应用越来越广泛。示例性的，在使用语音控制之前，APP(application)，应用程序)开发人员需要将支持语音控制的第三方APP的功能元素注册至语音引擎，并将每个功能元素与对应的功能实现接口关联，以使用户进行语音控制时，车机系统可以将用户的语音控制指令发送至对应的APP，由该APP调用对应的功能实现接口，实现某APP某功能控件的语音控制。

技术实现思路

[0003]本公开提供了一种语音控制方法、装置、电子设备及计算机可读存储介质。
[0004]根据本公开的一方面，提供了一种语音控制方法，包括：
[0005]在显示有目标界面的情况下，接收语音控制指令；
[0006]响应于所述语音控制指令，获取所述语音控制指令的自动语音识别结果；
[0007]在预设词库中确定所述自动语音识别结果对应的文本内容；其中，所述预设词库由对每个界面的每个功能控件对应的控件信息进行泛化处理得到，所述界面为多个且包括所述目标界面，所述控件信息包括每个所述功能控件的文字描述信息；
[0008]确定所述文本内容对应的目标功能控件；
[0009]基于所述目标功能控件执行所述语音控制指令。
[0010]根据本公开的另一方面，提供了一种...

【技术保护点】

【技术特征摘要】
1.一种语音控制方法，包括：在显示有目标界面的情况下，接收语音控制指令；响应于所述语音控制指令，获取所述语音控制指令的自动语音识别结果；在预设词库中确定所述自动语音识别结果对应的文本内容；其中，所述预设词库由对每个界面的每个功能控件对应的控件信息进行泛化处理得到，所述界面为多个且包括所述目标界面，所述控件信息包括每个所述功能控件的文字描述信息；确定所述文本内容对应的目标功能控件；基于所述目标功能控件执行所述语音控制指令。2.根据权利要求1所述的方法，所述在显示有目标界面的情况下，接收语音控制指令之前，还包括：获取每个所述界面中的至少一个功能控件；获取每个所述界面中的每个所述功能控件对应的控件信息；其中，所述控件信息包括功能控件对应的根功能控件的控件信息、所述根功能控件信息的至少一个子功能控件的控件信息；按照预设泛化规则基于每个所述功能控件的文字描述信息，生成所述预设词库。3.根据权利要求2所述的方法，其中，所述按照预设泛化规则基于每个所述功能控件的文字描述信息，生成所述预设词库，包括：基于第一预设词槽和第二预设词槽，对每个所述功能控件的文字描述信息进行泛化处理，得到所述预设词库；其中，所述第一预设词槽用于指示对所述功能控件的文字描述信息的具体执行动作，所述第二预设词槽用于指示对所述功能控件的文字描述信息的具体执行内容。4.根据权利要求2所述的方法，其中，所述控件信息还包括用于指示所述功能控件是否可操作的信息。5.根据权利要求4所述的方法，其中，所述确定所述文本内容对应的目标功能控件，包括：确定所述文本内容对应的第一功能控件；获取所述第一功能控件对应的第一控件信息；根据所述第一控件信息确定所述第一功能控件是否可操作；响应于所述第一功能控件可操作，将所述第一功能控件确定为所述文本内容对应的目标功能控件。6.根据权利要求5所述的方法，所述方法还包括：响应于所述第一功能控件不可操作，确定所述第一功能控件的第一父功能控件是否可操作；响应于所述第一父功能控件可操作，将所述第一父功能控件确定为所述文本内容对应的目标功能控件。7.根据权利要求6所述的方法，所述方法还包括：响应于所述第一父功能控件不可操作，确定所述第一父功能控件的第二父功能控件是否可操作；响应于所述第二父功能控件可操作，将所述第二父功能控件确定为所述文本内容对应
的目标功能控件；响应于所述第二父功能控件不可操作，按照预设遍历方式遍历确定所述第二父功能控件的父功能控件是否存在可操作的父功能控件；其中，所述预设遍历方式包括按照功能控件的树状结构从小到大的顺序依次遍历每个功能控件的父功能控件，直至遍历至根功能控件；响应于所述第二父功能控件的父功能控件存在可操作的父功能控件，将所述第二父功能控件的父功能控件中最小且可操作的父功能控件确定为所述文本内容对应的目标功能控件。8.根据权利要求7所述的方法，所述控件信息还包括所述功能控件的位置信息。9.根据权利要求8所述的方法，所述方法还包括：响应于所述第二父功能控件的父功能控件不存在可操作的父功能控件，获取所述第一功能控件的位置信息；将所述目标界面中与所述第一功能控件的位置信息的距离最近的功能控件，确定为所述文本内容对应的目标功能控件。10.根据权利要求9所述的方法，其中，所述将所述目标界面中与所述第一功能控件的位置信息的距离最近的功能控件，确定为所述文本内容对应的目标功能控件，包括：确定所述目标界面中在所述第一功能控件的预设方向与所述第一功能控件的位置信息的距离最近的第二功能控件；其中，所述预设方向为至少一个；获取每个所述第二功能控件对应的控件信息；根据每个所述第二功能控件对应的控件信息中用于指示功能控件是否可操作的信息，确定所述第二功能控件中可操作的第三功能控件；响应于所述第三功能控件的数量为1，将所述第三功能控件确定为所述文本内容对应的目标功能控件。11.根据权利要求10所述的方法，所述方法还包括：响应于所述第三功能控件的数量大于1，将第三功能控件中与所述第一功能控件的位置信息的距离最近的所述第三功能控件，确定为所述文本内容对应的目标功能控件。12.一种语音控制装置，包括：指令接收模块，用于在显示有目标界面的情况下，接收语音控制指令；第一获取模块，用于响应于所述语音控制指令，获取所述语音控制指令的自动语音识别结果；第一确定模块，用于在预设词库中确定所述自动语音识别结果对应的文本内容；其中，所述预设词库由对每个界面的每个功能控件对应的控件信息进行泛化处理得到，所述界面为多个且包括所述目标界面，所述控件信息包括每个所述功能控件...

【专利技术属性】
技术研发人员：周文欢，
申请(专利权)人：阿波罗智联北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人