语音指令匹配方法、装置、设备、车辆及存储介质制造方法及图纸

技术编号:39147356 阅读:16 留言:0更新日期:2023-10-23 14:57
本公开提供了一种语音指令匹配方法、装置、设备、车辆及存储介质,涉及数据处理技术领域,尤其涉及语音识别领域、语音交互领域等。实现方案为:获取当前待匹配字段,当前待匹配字段为语音指令中至少包含一个文字的字段;对当前待匹配字段进行匹配,在当前待匹配字段匹配成功的情况下,将语音指令中的当前待匹配字段的下一文字确定为新的当前待匹配字段。在对语音指令进行匹配时,能够对同一语音指令中的多个待匹配字段进行匹配,且当前待匹配字段匹配成功后,下一次匹配可以忽略已匹配成功的当前待匹配字段,直接从当前待匹配字段之后的文字开始进行新一轮匹配,使得一次语音指令可以实现多次匹配和响应操作,且成功率高,提升用户使用体验。使用体验。使用体验。

【技术实现步骤摘要】
语音指令匹配方法、装置、设备、车辆及存储介质


[0001]本公开涉及数据处理
,尤其涉及语音识别领域、语音交互领域等,具体涉及一种语音指令匹配方法、装置、设备、车辆及存储介质。

技术介绍

[0002]当前,随着智能汽车的普及,车载语音助手已经从早期的“声音遥控器”转变为车主的“语音助理”,可以方便地用语音发起导航、点播歌曲等功能。同时,车内生态也逐渐丰富起来了,但各个应用之间都是独立的信息孤岛,语音助手打通车内生态的成本却很高。为了解决此类问题,行业内的通用做法是抓取到生态应用的页面元素注册到语音助手,一旦语音触发到相同词汇,则会通过动作引擎,在相应词汇的位置附近模拟出相应的点击或滑动效果,这种语音交互方式就叫所见即可说。如何提升可见即可说的性能,逐渐成为研究的热点。

技术实现思路

[0003]本公开提供了一种语音指令匹配方法、装置、设备、车辆及存储介质。
[0004]根据本公开的一方面,提供了一种语音指令匹配方法,包括:获取当前待匹配字段,当前待匹配字段为语音指令中至少包含一个文字的字段;对当前待匹配字段进行匹配,在当前待匹配字段匹配成功的情况下,将语音指令中的当前待匹配字段的下一文字确定为新的当前待匹配字段。
[0005]根据本公开的另一方面,提供了一种语音指令匹配装置,包括:获取单元,用于获取当前待匹配字段,当前待匹配字段为语音指令中至少包含一个文字的字段;匹配单元,用于对当前待匹配字段进行匹配,在当前待匹配字段匹配成功的情况下,将语音指令中的当前待匹配字段的下一文字确定为新的当前待匹配字段。
[0006]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与该至少一个处理器通信连接的存储器;其中,该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开实施例中任一的方法。
[0007]根据本公开的另一方面,提供了一种车辆,包括:上述任一项所述的电子设备。
[0008]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。
[0009]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。
[0010]本公开实施例提供的语音指令匹配方法、装置、设备、车辆及存储介质,通过获取当前待匹配字段,当前待匹配字段为语音指令中至少包含一个文字的字段;对当前待匹配字段进行匹配,在当前待匹配字段匹配成功的情况下,将语音指令中的当前待匹配字段的下一文字确定为新的当前待匹配字段。在对语音指令进行匹配时,能够对同一语音指令中
的多个待匹配字段进行匹配,且当前待匹配字段匹配成功后,下一次匹配可以忽略已匹配成功的当前待匹配字段,直接从当前待匹配字段之后的文字开始进行新一轮匹配,从而使得一次语音指令可以实现多次匹配,进而根据多次匹配结果响应多个操作指令,即实现多次响应操作,匹配成功率更高,且提升了用户使用体验。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1为应用本公开实施例的语音指令匹配方法的系统的结构示意图;
[0014]图2是根据本公开一实施例提供的语音指令匹配方法的流程图;
[0015]图3是根据本公开又一实施例提供的语音指令匹配方法的流程图;
[0016]图4是根据本公开一实施例提供的语音指令匹配方法的示意图;
[0017]图5是根据本公开又一实施例提供的语音指令匹配方法的示意图;
[0018]图6是根据本公开一实施例提供的语音指令匹配装置的结构图;
[0019]图7是用来实现本公开实施例的语音指令匹配方法的电子设备的框图。
具体实施方式
[0020]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0021]本公开实施例提供一种语音指令匹配方法、装置、设备、车辆及存储介质。具体地,本公开实施例的语音指令匹配方法可以由电子设备执行,其中,该电子设备可以为终端或者服务器等设备。该终端可以为智能手机、平板电脑、笔记本电脑、智能语音交互设备、智能家电、穿戴式智能设备、飞行器、智能车载终端等设备,终端还可以包括客户端,该客户端可以是音频客户端、视频客户端、浏览器客户端、即时通信客户端或小程序等。服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0022]相关技术中,所见即可说方式在对用户语音进行识别时,语音引擎需要检测到语音尾点才会回传ASR(Automatic Speech Recognition,自动语音识别)文本给所见即可说模块进行执行,因此,当用户如果连续说出屏幕上多个页面元素时,往往只会匹配其中一个,即一次交互只能响应语音指令中的一条操作指令,甚至一个都无法匹配成功,即无法完成交互。因此,用户在使用时不得不配合语音识别模块,念一个词,停顿一下,等待该词匹配成功,然后再念下一个词,因此,用户体验较差。
[0023]另外,虽然相关技术中的语音检测解决了应用打通的广度,但是由于需要等待检测语音尾点,因此,该方式还是受限语音识别端本身的速度,每次交互通常都在2

3秒,语音
交互的速度慢,效率较低。
[0024]为了解决上述问题中的至少一个,本公开提供一种语音指令匹配方法、装置、设备、车辆及存储介质,通过获取当前待匹配字段,当前待匹配字段为语音指令中至少包含一个文字的字段;对当前待匹配字段进行匹配,在当前待匹配字段匹配成功的情况下,将语音指令中的当前待匹配字段的下一文字确定为新的当前待匹配字段。在对语音指令进行匹配时,能够对同一语音指令中的多个待匹配字段进行匹配,且当前待匹配字段匹配成功后,下一次匹配可以忽略已匹配成功的当前待匹配字段,直接从当前待匹配字段之后的文字开始进行新一轮匹配,从而使得一次语音指令可以实现多次匹配,进而根据多次匹配结果响应多个操作指令,即实现多次响应操作,匹配成功率更高,且提升了用户使用体验。
[0025]以下将结合附图对本公开实施例进行具体说明。
[0026]图1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音指令匹配方法,包括:获取当前待匹配字段,所述当前待匹配字段为语音指令中至少包含一个文字的字段;对所述当前待匹配字段进行匹配,在所述当前待匹配字段匹配成功的情况下,将所述语音指令中的所述当前待匹配字段的下一文字确定为新的当前待匹配字段。2.根据权利要求1所述的方法,还包括:在所述当前待字段匹配失败的情况下,将所述当前待匹配字段的起始文字确定为新的当前待匹配字段的起始文字,并将所述语音指令中的所述当前待匹配字段的下一文字确定为新的当前待匹配字段的结束文字;基于所述新的当前待匹配字段的起始文字以及所述新的当前待匹配字段的结束文字,确定所述新的当前待匹配字段。3.根据权利要求2所述的方法,其中,所述当前待匹配字段具有用于指示所述当前待匹配字段的起始文字的目标标记;在所述当前待匹配字段匹配成功的情况下,将所述语音指令中的所述当前待匹配字段的下一文字确定为新的当前待匹配字段,包括:在所述当前待匹配字段匹配成功的情况下,更新所述目标标记的位置,以使更新后的所述目标标记用于指示所述当前待匹配字段的下一文字;将更新后的所述目标标记所指示的文字确定为所述新的当前待匹配字段。4.根据权利要求3所述的方法,其中,在所述当前待字段匹配失败的情况下,将所述当前待匹配字段的起始文字确定为新的当前待匹配字段的起始文字,包括:在所述当前待字段匹配失败的情况下,保持所述目标标记的位置不变,并将所述目标标记所指示的文字确定为所述新的当前待匹配字段的起始文字。5.根据权利要求2所述的方法,其中,在所述当前待匹配字段匹配成功的情况下,将所述语音指令中的所述当前待匹配字段的下一文字确定为新的当前待匹配字段,包括:在所述当前待匹配字段匹配成功的情况下,将所述当前待匹配字段从语音文字集中删除,以更新所述语音文字集,所述语音文字集为用于记录所述语音指令中的文字的集合;将更新后的所述语音文字集的第一个文字确定为所述新的当前待匹配字段。6.根据权利要求5所述的方法,其中,在所述当前待字段匹配失败的情况下,将所述当前待匹配字段的起始文字确定为新的当前待匹配字段的起始文字,并将所述语音指令中的所述当前待匹配字段的下一文字确定为新的当前待匹配字段的结束文字,包括:在所述当前待字段匹配失败的情况下,保持所述语音文字集的第一个文字不变,并将所述语音文字集中的第一个文字确定为所述新的当前待匹配字段的起始文字;将所述语音文字集中的所述当前待匹配字段的下一文字确定为新的当前待匹配字段的结束文字。7.根据权利要求1

6中任一项所述的方法,获取当前待匹配字段,包括:实时获取所述语音指令中的当前文字;确定所述当前文字对应的所述当前待匹配字段,所述当前待匹配字段的结束文字为当前文字,且所述当前待匹配字段的起始文字为所述语音指令中的第一个文字、或者为所述语音指令中最近一次匹配成功的待匹配字段的下一文字。8.根据权利要求1

6中任一项所述的方法,其中,对所述当前待匹配字段进行匹配,在
所述当前待匹配字段匹配成功的情况下,将所述语音指令中的所述当前待匹配字段的下一文字确定为新的当前待匹配字段,包括:将所述当前待匹配字段与显示界面中的多个操作控件的名称进行匹配;在所述当前待匹配字段与所述多个操作控件中的目标操作控件的名称匹配成功的情况下,对所述目标操作控件进行选取操作;将所述语音指令中的所述当前待匹配字段的下一文字确定为新的当前待匹配字段。9.根据权利要求8所述的方法,其中,所述显示界面为车载终端的显示界面。10.一种语音指令匹配装置,包括:获取单元,用于获取当前待匹配字段...

【专利技术属性】
技术研发人员:欧阳能钧华鲸州刘嵘刘佳
申请(专利权)人:阿波罗智联北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1