语音识别模型的评估方法及装置、电子设备和存储介质制造方法及图纸

技术编号:38546068 阅读:10 留言:0更新日期:2023-08-22 20:55
本公开提供了一种语音识别模型的评估方法及装置、电子设备和存储介质,将待标注语音数据集划分为预设数量的数据分块;将预设数量的数据分块分别输入对应数量的语音识别模型,分别得到每个语音识别模型对应的识别结果集;从不同识别结果集中分别确定一个识别结果作为参考识别文本;在对参考识别文本进行标注处理后,基于标注后的参考识别文本依次对每个语音识别模型进行评估。与相关技术相比,通过在每个识别结果集中分别确定一个识别结果作为参考识别文本,于标注结果实现对每个语音识别模型的评估。通过交叉生成参考识别文本,能够减少参考识别文本的标注效果对语音识别模型的识别准确率的影响,进而能实现对语音识别模型的客观评估。型的客观评估。型的客观评估。

【技术实现步骤摘要】
语音识别模型的评估方法及装置、电子设备和存储介质


[0001]本公开涉及数据处理
,尤其涉及一种语音识别模型的评估方法及装置、电子设备和存储介质。

技术介绍

[0002]随着语音识别技术的发展,语音识别模型能够识别的数量变得越来越大。同时,也对语音识别模型的识别准确度也提出了更高的要求。语音数据的标注影响着语音识别模型的准确率。语音标注根据参考识别文本进行标注,语音标注的过程中会受到多种因素的影响,导致标注效果不佳,进而会影像语音识别模型的识别准确率。由于语音标注的好坏直接影响着语音识别模型的识别精度,若使用不同的参考识别文本对不同语音识别模型进行训练,在对语音识别模型进行评估时,无法直接对模型的优劣进行判断。

技术实现思路

[0003]本公开提供了一种语音识别模型的评估方法及装置、电子设备和存储介质。其主要目的在于实现对不同语音识别模型的评估。
[0004]根据本公开的第一方面,提供了一种语音识别模型的评估方法,其中,包括:
[0005]将待标注语音数据集划分为预设数量的数据分块;
[0006]将所述预设数量的数据分块分别输入对应数量的语音识别模型,分别得到每个所述语音识别模型对应的识别结果集;其中,每个所述数据分块对应一个识别结果;
[0007]从不同所述识别结果集中分别确定一个识别结果作为参考识别文本;
[0008]在对所述参考识别文本进行标注处理后,基于标注后的参考识别文本依次对每个所述语音识别模型进行评估。
[0009]可选的,所述在对所述参考识别文本进行标注处理后,基于标注后的参考识别文本依次对每个所述语音识别模型进行评估包括:
[0010]在每个所述识别结果集中分别选取一个所述数据分块对应的目标识别结果,生成不同的、预设数量的目标识别结果组合;
[0011]基于所述标注后的参考识别文本,计算所述预设数量的目标识别结果组合的第一识别错误率;
[0012]基于所述第一错误率,对每个所述语音识别模型进行评估。
[0013]可选的,所述将待标注语音数据集划分为预设数量的数据分块包括:
[0014]获取所述待标注语音数据集中待标注语音数据的数量;
[0015]基于待标注语音数据的数量,将所述待标注语音数据集等分为所述预设数量的数据分块。
[0016]可选的,所述将所述预设数量的数据分块分别输入对应数量的语音识别模型,分别得到每个所述语音识别模型对应的识别结果集包括:
[0017]利用每个所述语音识别模型分别对每个所述数据分块进行识别处理,得到每个所
述语音识别模型对每个所述数据分块的识别结果;
[0018]将任一个所述语音识别模型对每个所述数据分块的识别结果生成一个所述识别结果集。
[0019]可选的,所述从不同所述识别结果集中分别确定一个识别结果作为参考识别文本包括:
[0020]分别从不同所述识别结果集中选取一个所述数据分块对应的识别结果作为参考识别文本,其中,选取的所有的数据分块组成所述待标注语音数据集。
[0021]可选的,在对所述参考识别文本进行标注处理后,所述方法还包括:
[0022]计算不同批次下的每个所述识别结果集的第二识别错误率;
[0023]基于所述第二识别错误率及所述标注结果,生成不同批次下标注处理的标注波动;
[0024]基于所述标注波动,对所述标注结果进行评估。
[0025]根据本公开的第二方面,提供了一种语音识别模型的评估装置,包括:
[0026]划分单元,用于将待标注语音数据集划分为预设数量的数据分块;
[0027]处理单元,用于将所述预设数量的数据分块分别输入对应数量的语音识别模型,分别得到每个所述语音识别模型对应的识别结果集;其中,每个所述数据分块对应一个识别结果;
[0028]第一生成单元,用于从不同所述识别结果集中分别确定一个识别结果作为参考识别文本;
[0029]第一评估单元,用于在对所述参考识别文本进行标注处理后,基于标注后的参考识别文本依次对每个所述语音识别模型进行评估。
[0030]可选的,所述第一评估单元包括:
[0031]第一生成模块,用于在每个所述识别结果集中分别选取一个所述数据分块对应的目标识别结果,生成不同的、预设数量的目标识别结果组合;
[0032]计算模块,用于基于所述标注后的参考识别文本,计算所述预设数量的目标识别结果组合的第一识别错误率;
[0033]评估模块,用于基于所述第一错误率,对每个所述语音识别模型进行评估。
[0034]可选的,所述划分单元包括:
[0035]获取模块,用于获取所述待标注语音数据集中待标注语音数据的数量;
[0036]划分模块,用于基于待标注语音数据的数量,将所述待标注语音数据集等分为所述预设数量的数据分块。
[0037]可选的,所述处理单元包括:
[0038]处理模块,用于利用每个所述语音识别模型分别对每个所述数据分块进行识别处理,得到每个所述语音识别模型对每个所述数据分块的识别结果;
[0039]第二生成模块,用于将任一个所述语音识别模型对每个所述数据分块的识别结果生成一个所述识别结果集。
[0040]可选的,所述第一生成单元还用于:
[0041]分别从不同所述识别结果集中选取一个所述数据分块对应的识别结果作为参考识别文本,其中,选取的所有的数据分块组成所述待标注语音数据集。
[0042]可选的,所述装置还包括:
[0043]计算单元,用于在对所述参考识别文本进行标注处理后,计算不同批次下的每个所述识别结果集的第二识别错误率;
[0044]第二生成单元,用于基于所述第二识别错误率及所述标注结果,生成不同批次下标注处理的标注波动;
[0045]第二评估单元,用于基于所述标注波动,对所述标注结果进行评估。
[0046]根据本公开的第三方面,提供了一种电子设备,包括:
[0047]至少一个处理器;以及
[0048]与所述至少一个处理器通信连接的存储器;其中,
[0049]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述第一方面所述的方法。
[0050]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行前述第一方面所述的方法。
[0051]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如前述第一方面所述的方法。
[0052]本公开提供了一种语音识别模型的评估方法及装置、电子设备和存储介质,将待标注语音数据集划分为预设数量的数据分块;将所述预设数量的数据分块分别输入对应数量的语音识别模型,分别得到每个所述语音识别模型对应的识别结果集;
[0053]其中,每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别模型的评估方法,其特征在于,包括:将待标注语音数据集划分为预设数量的数据分块;将所述预设数量的数据分块分别输入对应数量的语音识别模型,分别得到每个所述语音识别模型对应的识别结果集;其中,每个所述数据分块对应一个识别结果;从不同所述识别结果集中分别确定一个识别结果作为参考识别文本;在对所述参考识别文本进行标注处理后,基于标注后的参考识别文本依次对每个所述语音识别模型进行评估。2.根据权利要求1所述的方法,其特征在于,所述在对所述参考识别文本进行标注处理后,基于标注后的参考识别文本依次对每个所述语音识别模型进行评估包括:在每个所述识别结果集中分别选取一个所述数据分块对应的目标识别结果,生成不同的、预设数量的目标识别结果组合;基于所述标注后的参考识别文本,计算所述预设数量的目标识别结果组合的第一识别错误率;基于所述第一错误率,对每个所述语音识别模型进行评估。3.根据权利要求1所述的方法,其特征在于,所述将待标注语音数据集划分为预设数量的数据分块包括:获取所述待标注语音数据集中待标注语音数据的数量;基于待标注语音数据的数量,将所述待标注语音数据集等分为所述预设数量的数据分块。4.根据权利要求1所述的方法,其特征在于,所述将所述预设数量的数据分块分别输入对应数量的语音识别模型,分别得到每个所述语音识别模型对应的识别结果集包括:利用每个所述语音识别模型分别对每个所述数据分块进行识别处理,得到每个所述语音识别模型对每个所述数据分块的识别结果;将任一个所述语音识别模型对每个所述数据分块的识别结果生成一个所述识别结果集。5.根据权利要求1所述的方法,其特征在于,所述从不同所述识别结果集中分别确定一个识别结果作为参考识别文本包括:分别...

【专利技术属性】
技术研发人员:王伟戌
申请(专利权)人:北京云思智学科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1