语音识别方法、语音处理方法、装置和自动驾驶车辆制造方法及图纸

技术编号:32492768 阅读:19 留言:0更新日期:2022-03-02 09:59
本公开提供了一种语音识别方法、语音处理方法、装置、设备、介质、产品和自动驾驶车辆,涉及人工智能领域,尤其涉及语音技术、自动驾驶技术领域。语音识别方法包括:对待识别语音数据进行识别处理,得到第一识别结果;响应于第一识别结果表征待识别语音数据包括唤醒语音数据,对唤醒语音数据进行识别处理,得到第二识别结果;响应于第二识别结果表征唤醒语音数据中包括标识数据,禁止电子设备响应唤醒语音数据。数据。数据。

【技术实现步骤摘要】
语音识别方法、语音处理方法、装置和自动驾驶车辆


[0001]本公开涉及人工智能领域,尤其涉及语音技术、自动驾驶
,更具体地,涉及一种语音识别方法、语音处理方法、装置、电子设备、介质、程序产品和自动驾驶车辆。

技术介绍

[0002]相关技术中,多种设备均设置有语音唤醒功能,多种设备例如包括但不仅限于手机、自动驾驶车辆的车载系统、智能音箱。相关技术中设备的语音唤醒效果不佳。

技术实现思路

[0003]本公开提供了一种语音识别方法、语音处理方法、装置、电子设备、存储介质、程序产品和自动驾驶车辆。
[0004]根据本公开的一方面,提供了一种语音识别方法,包括:对待识别语音数据进行识别处理,得到第一识别结果;响应于所述第一识别结果表征所述待识别语音数据包括唤醒语音数据,对所述唤醒语音数据进行识别处理,得到第二识别结果;响应于所述第二识别结果表征所述唤醒语音数据中包括标识数据,禁止电子设备响应所述唤醒语音数据。
[0005]根据本公开的另一方面,提供了一种语音处理方法,包括:采集当前语音数据;响应于所述当前语音数据中包括第一唤醒语音数据,生成待识别语音数据,其中,所述待识别语音数据包括第二唤醒语音数据,所述第二唤醒语音数据包括标识数据。
[0006]根据本公开的另一方面,提供了一种语音识别装置,包括:第一识别模块、第二识别模块以及禁止模块。第一识别模块,用于对待识别语音数据进行识别处理,得到第一识别结果;第二识别模块,用于响应于所述第一识别结果表征所述待识别语音数据包括唤醒语音数据,对所述唤醒语音数据进行识别处理,得到第二识别结果;禁止模块,用于响应于所述第二识别结果表征所述唤醒语音数据中包括标识数据,禁止电子设备响应所述唤醒语音数据。
[0007]根据本公开的另一方面,提供了一种语音处理装置,包括:采集模块、生成模块和输出模块。采集模块,用于采集当前语音数据;生成模块,用于响应于所述当前语音数据中包括第一唤醒语音数据,生成待识别语音数据,其中,所述待识别语音数据包括第二唤醒语音数据,所述第二唤醒语音数据包括标识数据;输出模块,用于输出所述待识别语音数据。
[0008]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器和与所述至少一个处理器通信连接的存储器。其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的语音识别方法和/或语音处理方法。
[0009]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述的语音识别方法和/或语音处理方法。
[0010]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述的语音识别方法和/或语音处理方法。
[0011]根据本公开的另一方面,提供了一种自动驾驶车辆,包括上述的电子设备。
[0012]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0013]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0014]图1示意性示出了一种示例的语音唤醒的应用场景;
[0015]图2示意性示出了根据本公开一实施例的语音识别方法的流程图;
[0016]图3示意性示出了根据本公开一实施例的语音识别方法的示意图;
[0017]图4示意性示出了根据本公开一实施例的语音处理方法的流程图;
[0018]图5示意性示出了根据本公开一实施例的语音识别方法和语音处理方法的原理图;
[0019]图6示意性示出了根据本公开一实施例的语音识别装置的框图;
[0020]图7示意性示出了根据本公开一实施例的语音处理装置的框图;以及
[0021]图8是用来实现本公开实施例的用于执行语音识别和/或语音处理的电子设备的框图。
具体实施方式
[0022]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0023]在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
[0024]在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
[0025]在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
[0026]图1示意性示出了一种示例的语音唤醒的应用场景。
[0027]如图1所示,本公开实施例的应用场景100例如包括电子设备110和交互对象120。
[0028]电子设备110例如具有语音唤醒功能。当电子设备110采集到的语音中包括唤醒词时,电子设备110响应于唤醒词执行相关操作,相关操作例如包括唤醒操作。电子设备110例如包括但不仅限于手机、自动驾驶车辆的车载系统、智能音箱。
[0029]交互对象120可以和电子设备110进行语音交互,例如,当电子设备110采集到来自交互对象120的语音“找附近的停车场”时,电子设备110基于接收到的语音执行寻找停车场
的操作,执行操作完成之后,输出语音“找到以下停车场,请问选择第几个”。交互对象120基于电子设备110输出的语音进行回复,回复语音为“选择第一个”,其中的“第一个”例如为电子设备110预先设置的唤醒词。
[0030]电子设备110接收到包含唤醒词的语音“选择第一个”之后,基于唤醒词输出回复语音“好的,已为您选择第一个”。但是,由于电子设备110输出的回复语音“好的,已为您选择第一个”中还是包括唤醒词“第一个”,电子设备110在采集语音时将会采集到自身输出的语音“好的,已为您选择第一个”,并再次基于采集到的语音中的唤醒词“第一个”被唤醒,被唤醒后再次输出的回复语音“好的,已为您选择第一个”,以此循环影响使用体验。
[0031]有鉴于此,本公开的实施例提出了一种优化的语音唤醒方法。下面参考图2~图5来描述根据本公开示例性实施方式的语音识别方法和语音处理方法。
[0032]图2示意性示出了根据本公开一实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法,包括:对待识别语音数据进行识别处理,得到第一识别结果;响应于所述第一识别结果表征所述待识别语音数据包括唤醒语音数据,对所述唤醒语音数据进行识别处理,得到第二识别结果;响应于所述第二识别结果表征所述唤醒语音数据中包括标识数据,禁止电子设备响应所述唤醒语音数据。2.根据权利要求1所述的方法,其中,所述对所述唤醒语音数据进行识别处理,得到第二识别结果包括:基于所述唤醒语音数据的频率,从所述唤醒语音数据中确定目标语音片段;对所述目标语音片段进行处理,以确定所述目标语音片段中是否具有所述标识数据。3.根据权利要求2所述的方法,其中,所述目标语音片段包括以下至少一个:所述唤醒语音数据中频率大于第一频率阈值的语音片段;所述唤醒语音数据中频率小于第二频率阈值的语音片段。4.一种语音处理方法,包括:采集当前语音数据;响应于所述当前语音数据中包括第一唤醒语音数据,生成待识别语音数据,其中,所述待识别语音数据包括第二唤醒语音数据,所述第二唤醒语音数据包括标识数据;输出所述待识别语音数据。5.根据权利要求4所述的方法,其中,所述响应于所述当前语音数据中包括第一唤醒语音数据,生成待识别语音数据包括:基于所述第一唤醒语音数据,生成第二唤醒语音数据;将所述标识数据添加至所述第二唤醒语音数据,得到更新的第二唤醒语音数据;基于所述更新的第二唤醒语音数据,生成所述待识别语音数据。6.根据权利要求5所述的方法,其中,所述将所述标识数据添加至所述第二唤醒语音数据,得到更新的第二唤醒语音数据包括:基于所述第二唤醒语音数据的频率,从所述第二唤醒语音数据中确定目标语音片段;将所述标识数据添加至所述目标语音片段,得到更新的第二唤醒语音数据。7.根据权利要求6所述的方法,其中,所述目标语音片段包括以下至少一个:所述第二唤醒语音数据中频率大于第一频率阈值的语音片段;所述第二唤醒语音数据中频率小于第二频率阈值的语音片段。8.一种语音识别装置,包括:第一识别模块,用于对待识别语音数据进行识别处理,得到第一识别结果;第二识别模块,用于响应于所述第一识别结果表征所述待识别语音数据包括唤醒语音数据,对所述唤醒语音数据进行识别处理,得到第二识别结果;禁止模块,用于响应于所述第二识别结果表征所述唤醒语音数据中包括标识数据,禁止电子设备响应所述唤醒语音数据。9.根据权利要求8所述的装置,其...

【专利技术属性】
技术研发人员:曹济任
申请(专利权)人:阿波罗智行科技广州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1