System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 语音控制方法、装置、设备、存储介质及程序产品制造方法及图纸_技高网

语音控制方法、装置、设备、存储介质及程序产品制造方法及图纸

技术编号:40078165 阅读:11 留言:0更新日期:2024-01-17 01:55
本申请公开一种语音控制方法、装置、设备、存储介质及程序产品,涉及语音技术领域。该方法包括:在第一时刻显示目标界面对应的第一显示画面;响应于在所述第一时刻接收到语音内容,对所述语音内容进行文本识别得到文本识别结果;提取所述第一显示画面对应的第一画面特征,以及提取所述目标界面在第二时刻的第二画面特征;基于所述第一画面特征和所述第二画面特征之间的画面特征变化情况,确定目标显示画面,并对所述目标显示画面进行文本识别,得到文本识别结果;基于所述文本识别结果和所述内容识别结果之间的内容匹配关系,在所述目标显示画面中确定目标显示内容,并自动触发所述目标显示内容。本申请用于提高语音控制效率。

【技术实现步骤摘要】

本申请实施例涉及语音,特别涉及一种语音控制方法、装置、设备、存储介质及程序产品


技术介绍

1、在驾驶场景下,用户可以通过语音实现对车载系统的自动控制,例如:用户生成语音指令“播放音乐”,车载系统接收到该语音指令后,自动打开音乐应用程序并播放音乐。

2、在相关技术中,当接收到语音内容后,先将语音内容转换为文本内容,再获取当前车载系统中显示界面对应的显示画面,对显示画面进行图像识别,得到图像识别结果,从而确定图像识别结果中与文本内容对应的图像区域,并触发该图像区域,实现语音自动控制。

3、然而在相关技术中,将语音内容转换为文本内容后与显示画面进行匹配的过程中,会存在多次重复获取同一显示画面的情况,降低了内容匹配效率,并且,对于带多音字的中文匹配识别也存在效率较低的问题,进而降低了语音控制的效率和准确度。


技术实现思路

1、本申请实施例提供了一种语音控制方法、装置、设备、存储介质及产品,能够提高语音控制效率。所述技术方案如下。

2、一方面,提供了一种语音控制方法,所述方法包括:

3、在第一时刻显示目标界面对应的第一显示画面;

4、提取所述第一显示画面对应的第一画面特征,以及提取所述目标界面在第二时刻的第二画面特征,所述第二画面特征是所述目标界面在所述第二时刻显示的第二显示画面对应的画面特征,所述第二时刻是位于所述第一时刻之前的历史时刻;

5、基于所述第一画面特征和所述第二画面特征之间的画面特征变化情况,确定目标显示画面,并对所述目标显示画面进行文本识别,得到所述目标显示画面对应的文本识别结果;

6、响应于在所述第一时刻接收到语音内容,对所述语音内容进行语音识别,得到语音识别结果;

7、基于所述文本识别结果和所述内容识别结果之间的内容匹配关系,在所述目标显示画面中确定目标显示内容,并自动触发所述目标显示内容。

8、另一方面,提供了一种语音控制装置,所述装置包括:

9、显示模块,用于在第一时刻显示目标界面对应的第一显示画面;

10、提取模块,用于提取所述第一显示画面对应的第一画面特征,以及提取所述目标界面在第二时刻的第二画面特征,所述第二画面特征是所述目标界面在所述第二时刻显示的第二显示画面对应的画面特征,所述第二时刻是位于所述第一时刻之前的历史时刻;

11、识别模块,用于基于所述第一画面特征和所述第二画面特征之间的画面特征变化情况,确定目标显示画面,并对所述目标显示画面进行文本识别,得到所述目标显示画面对应的文本识别结果;

12、所述识别模块,用于响应于在所述第一时刻接收到语音内容,对所述语音内容进行语音识别,得到语音识别结果;

13、确定模块,用于基于所述文本识别结果和所述内容识别结果之间的内容匹配关系,在所述目标显示画面中确定目标显示内容,并自动触发所述目标显示内容。

14、另一方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述本申请实施例中任一所述语音控制方法。

15、另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述本申请实施例中任一所述的语音控制方法。

16、另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述实施例中任一所述的语音控制方法。

17、本申请实施例提供的技术方案带来的有益效果至少包括:

18、在第一时刻显示目标界面对应的第一显示界面的过程中,并提取第一显示画面对应的第一画面特征,以及获取目标界面在第二时刻的第二画面特征,从而根据第一画面特征和第二画面特征之间的画面特征变化情况对第一显示画面进行文本识别,并且,在第一时刻接收到语音内容后,对该语音内容进行语音识别得到语音识别结果,将得到的文本识别结果与语音识别结果进行匹配,确定目标显示内容并进行自动触发。也即,通过比对当前时刻与历史时刻之间的画面特征差异,确定最终用于进行文本识别的显示画面,避免在显示画面不发生变化的情况下,对同一显示画面重复进行内文本识别,提高了文本识别效率,并且,将显示画面对应的文本识别结果实时传输给语音识别模块,强化语音识别模块的准确度,因而提高了语音控制效率和准确度。

本文档来自技高网...

【技术保护点】

1.一种语音控制方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一画面特征和所述第二画面特征之间的画面特征变化情况,确定目标显示画面,并对所述目标显示画面进行文本识别,得到所述目标显示画面对应的文本识别结果,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述第一画面特征和所述第二画面特征之间的画面特征变化情况,确定目标显示画面,并对所述目标显示画面进行文本识别,得到所述目标显示画面对应的文本识别结果,包括:

4.根据权利要求1至3任一所述的方法,其特征在于,所述在所述第一时刻提取所述第一显示画面对应的第一画面特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述提取所述第一显示画面对应的第一画面特征之前,还包括:

6.根据权利要求1至3任一所述的方法,其特征在于,所述响应于在所述第一时刻接收到语音内容,对所述语音内容进行文本识别,得到文本识别结果,包括:

7.根据权利要求1至3任一所述的方法,其特征在于,所述对所述语音内容进行文本识别,得到文本识别结果之后,还包括:

8.根据权利要求7所述的方法,其特征在于,所述用户意图中包括多种操作意图;

9.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述文本识别结果和所述内容识别结果之间的内容匹配关系,在所述第一显示画面中确定目标显示内容,包括:

10.一种语音控制装置,其特征在于,所述装置包括:

11.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如权利要求1至9任一所述的语音控制方法。

12.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如权利要求1至9任一所述的语音控制方法。

13.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9任一所述的语音控制方法。

...

【技术特征摘要】

1.一种语音控制方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一画面特征和所述第二画面特征之间的画面特征变化情况,确定目标显示画面,并对所述目标显示画面进行文本识别,得到所述目标显示画面对应的文本识别结果,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述第一画面特征和所述第二画面特征之间的画面特征变化情况,确定目标显示画面,并对所述目标显示画面进行文本识别,得到所述目标显示画面对应的文本识别结果,包括:

4.根据权利要求1至3任一所述的方法,其特征在于,所述在所述第一时刻提取所述第一显示画面对应的第一画面特征,包括:

5.根据权利要求4所述的方法,其特征在于,所述提取所述第一显示画面对应的第一画面特征之前,还包括:

6.根据权利要求1至3任一所述的方法,其特征在于,所述响应于在所述第一时刻接收到语音内容,对所述语音内容进行文本识别,得到文本识别结果,包括:

7.根据权利要求1至3...

【专利技术属性】
技术研发人员:汪帅
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1