一种语音识别引擎确定方法、装置及计算机设备制造方法及图纸

技术编号:33741626 阅读:25 留言:0更新日期:2022-06-08 21:39
本发明专利技术公开了一种语音识别引擎确定方法、装置及计算机设备,该方法包括,当确定本次采集的语音数据为首次采集的语音数据时,将语音数据分别输入到至少两个语音识别引擎,得到至少两个语音识别结果;在语义识别结果包括语音数据处理时间和语音数据处理自信度,基于语音数据处理时间和语音数据处理自信度,从至少两个语音识别引擎中选择一个语音识别引擎作为目标识别引擎。根据该方式,根据对首次采集的语音数据的处理结果,合理的选择目标识别引擎。针对场景的不同,选取与应用场景最适宜的目标识别引擎,可以充分利用某个语音识别引擎只针对特定场景的语音识别有效的特点,实现在不同语音识别场景灵活切换不同语音识别引擎,提升了用户体验度。提升了用户体验度。提升了用户体验度。

【技术实现步骤摘要】
一种语音识别引擎确定方法、装置及计算机设备


[0001]本专利技术涉及语音识别
,具体涉及一种语音识别引擎确定方法、装置及计算机设备。

技术介绍

[0002]随着汽车行业的发展,用户对车内语音识别助手的要求越来越高,由于导航车机的语音助手识别率普遍不是很好,不能准确识别驾驶人与乘车人的交互意图,导致对于驾驶人与乘车人的驾驶体验与语音控制体验等效果不佳。
[0003]现有技术下的语音助手采用的供应商引擎的识别与理解,针对某些特定场景或技能的识别有效,但是对于其他场景或技能,对语义识别与理解的效果不佳,甚至是无法识别,导致现有的语音助手在某些场景或技能下不能很好的识别与理解用户的意图。

技术实现思路

[0004]因此,本专利技术要解决的技术问题在于克服现有的车内语音识别助手存在对某些场景或技能的识别准确率不高的缺陷,从而提供一种语音识别引擎确定方法、装置及计算机设备。
[0005]根据第一方面,本专利技术实施例公开了一种语音识别引擎确定方法,该方法应用于任一个利用语音进行人机交互的场景下,方法包括:当确定本次采集的语音数据为首次采集的语音数据时,将语音数据分别输入到至少两个语音识别引擎,得到至少两个语音识别结果,其中,所述语音识别结果包括语音数据处理时间和语音数据处理自信度;基于所述语音数据处理时间和语音数据处理自信度,从至少两个所述语音识别引擎中选择一个语音识别引擎作为目标识别引擎,所述目标识别引擎用以对所述场景下后续采集的所述语音数据进行语义识别处理。
[0006]可选地,所述基于所述语音数据处理时间和语音数据处理自信度,从至少两个所述语音识别引擎中选择一个语音识别引擎作为目标识别引擎,包括:当所述语音数据处理时间相同时,直接根据所述语音数据处理自信度,从至少两个所述语音识别引擎中选择所述目标识别引擎;或者,当所述语音数据处理时间不同时,同时根据所述语音数据处理时间和所述语音数据处理自信度,从至少两个所述语音识别引擎中选择所述目标识别引擎。
[0007]可选地,当所述语音数据处理时间相同时,直接根据所述语音数据处理自信度,从至少两个所述语音识别引擎中选择所述目标识别引擎,包括:确定语音数据处理自信度符合预设自信度阈值的语音识别引擎作为所述目标识别引擎。
[0008]可选地,当所述语音数据处理自信度符合所述预设自信度阈值的语音识别引擎的数量包括至少两个时,选择语音数据处理自信度最高的语音识别引擎作为所述目标识别引擎。
[0009]可选地,当至少两个语音识别引擎中,未获取到语音数据处理自信度符合预设自信度阈值的语音识别引擎时,则确定目标语音识别引擎选取失败;选取语音数据处理自信
度最高的语音识别引擎,用以完成所述场景下后续采集的所述语音数据进行语义识别处理。
[0010]可选地,当所述语音数据处理时间不同时,同时根据所述语音数据处理时间和所述语音数据处理自信度,从至少两个所述语音识别引擎中选择所述目标识别引擎,包括:从语音数据处理自信度符合预设自信度阈值的语音识别引擎中,选取语音数据处理时间最短的语音识别引擎作为所述目标识别引擎。
[0011]可选地,当至少两个所述语音识别引擎中,所有语音数据处理自信度均不符合预设自信度阈值时,则确定目标语音识别引擎选取失败;选取语音数据处理自信度最高或者选取语音数据处理时间最短的语音识别引擎,用以完成所述场景下后续采集的所述语音数据进行语义识别处理。
[0012]根据第二方面,本专利技术实施例还公开了一种语音识别装置,包括:数据采集模块,用于采集语音数据;处理模块,用于当确定本次采集的语音数据为首次采集的语音数据时,将所述语音数据分别输入到至少两个语音识别引擎,得到至少两个语音识别结果,所述语音识别结果包括语音数据处理时间和语音数据处理自信度;识别引擎选择模块,用于基于所述语音数据处理时间和语音数据处理自信度,从至少两个所述语音识别引擎中选择一个语音识别引擎作为目标识别引擎,所述目标识别引擎用以对所述场景下后续采集的所述语音数据进行语义识别处理。
[0013]根据第三方面,本专利技术实施例还公开了一种计算机设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器执行如第一方面或第一方面任一可选实施方式的语音识别引擎确定方法的步骤。
[0014]根据第四方面,本专利技术实施方式还公开了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如第一方面或第一方面任一可选实施方式的语音识别引擎确定方法的步骤。
[0015]本专利技术技术方案,具有如下优点:
[0016]本专利技术提供的语音识别引擎确定方法,该方法应用于任一个利用语音进行人机交互的场景下,当确定本次采集的语音数据为首次采集的语音数据时,将语音数据分别输入到至少两个语音识别引擎,得到至少两个语音识别结果;在语义识别结果包括语音数据处理时间和语音数据处理自信度,基于语音数据处理时间和语音数据处理自信度,从至少两个语音识别引擎中选择一个语音识别引擎作为目标识别引擎。根据该方式,可以针对每一个利用语音进行人机交互的场景,根据对首次采集的语音数据的处理结果,从至少两个语音识别引擎中,合理的选择其中一个作为目标识别引擎。也即是,针对场景的不同,选取与应用场景最为适宜的一个目标识别引擎,用以识别该场景中的语音数据,从而可以充分利用某个语音识别引擎只针对特定场景的语音识别有效的特点,实现在不同语音识别场景灵活切换不同语音识别引擎,完成语义识别工作,进而保证最终获取的语义识别结果更加符合用户需求,更好的识别与理解用户的意图,大大提升用户体验度。
附图说明
[0017]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体
实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0018]图1为本专利技术实施例中语音识别引擎确定方法的一个具体示例的流程图;
[0019]图2为本专利技术实施例中语音识别引擎确定方法的一个具体实施例的示意图;
[0020]图3为本专利技术实施例中语音识别装置的一个具体示例的原理框图;
[0021]图4为本专利技术实施例中计算机设备的一个具体示例图。
具体实施方式
[0022]下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0023]在本专利技术的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别引擎确定方法,其特征在于,所述语音识别引擎确定方法应用于任一个利用语音进行人机交互的场景下,所述方法包括:当确定本次采集的语音数据为首次采集的语音数据时,将所述语音数据分别输入到至少两个语音识别引擎,得到至少两个语音识别结果,其中,所述语音识别结果包括语音数据处理时间和语音数据处理自信度;基于所述语音数据处理时间和语音数据处理自信度,从至少两个所述语音识别引擎中选择一个语音识别引擎作为目标识别引擎,所述目标识别引擎用以对所述场景下后续采集的所述语音数据进行语义识别处理。2.根据权利要求1所述的语音识别引擎确定方法,其特征在于,所述基于所述语音数据处理时间和语音数据处理自信度,从至少两个所述语音识别引擎中选择一个语音识别引擎作为目标识别引擎,包括:当所述语音数据处理时间相同时,直接根据所述语音数据处理自信度,从至少两个所述语音识别引擎中选择所述目标识别引擎;或者,当所述语音数据处理时间不同时,同时根据所述语音数据处理时间和所述语音数据处理自信度,从至少两个所述语音识别引擎中选择所述目标识别引擎。3.根据权利要求2所述的语音识别引擎确定方法,其特征在于,当所述语音数据处理时间相同时,直接根据所述语音数据处理自信度,从至少两个所述语音识别引擎中选择所述目标识别引擎,包括:确定语音数据处理自信度符合预设自信度阈值的语音识别引擎作为所述目标识别引擎。4.根据权利要求3所述的语音识别引擎确定方法,其特征在于,当所述语音数据处理自信度符合所述预设自信度阈值的语音识别引擎的数量包括至少两个时,选择语音数据处理自信度最高的语音识别引擎作为所述目标识别引擎。5.根据权利要求3所述的语音识别引擎确定方法,其特征在于,当至少两个语音识别引擎中,未获取到语音数据处理自信度符合预设自信度阈值的语音识别引擎时,则确定目标语音识别引擎选取失败;选取语音数据处理自信度最高的语音识别引擎,用以完成所述场景下后续采集...

【专利技术属性】
技术研发人员:王俊伟
申请(专利权)人:南京四维智联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1