【技术实现步骤摘要】
语音识别模型选择方法、装置、电子设备及存储介质
[0001]本申请涉及计算机
,尤其涉及一种语音识别模型选择方法、装置、电子设备及存储介质。
技术介绍
[0002]相关技术中,对于不同的语音识别应用场景,通常采用通用的语音识别技术模型,但由于不同模型都有相应的约束条件,通用的语音识别模型不能够适用于所有应用场景,因此相关技术存在着语音识别模型与应用场景适配性较差而导致的语音识别准确性较低的问题。
技术实现思路
[0003]有鉴于此,本申请的目的在于提出一种语音识别模型选择方法、装置、电子设备及存储介质。
[0004]基于上述目的,在第一方面,本申请提供了一种语音识别模型选择方法,包括:
[0005]根据决策树模型构建评价指标;
[0006]对预先录制的初始音频数据执行预处理操作以确定测试音频数据,并根据与所述初始音频数据对应的初始文本数据确定与所述测试音频数据对应的测试文本数据;
[0007]对于预先获取的每个语音识别模型,
[0008]将所述测试音频数据输入所述语音识别模型以确定识别文本数据,
[0009]根据所述测试文本数据和所述识别文本数据确定所述语音识别模型在评价指标的评价数据;
[0010]根据多个所述评价数据对每个语音识别模型在评价指标进行排序以确定每个语音识别模型对应的总得分;
[0011]选择所述总得分最高的语音识别模型作为目标语音识别模型。
[0012]在第二方面,本申请提供了一种语音识别模型选择装置,包括 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别模型选择方法,其特征在于,包括:根据决策树模型构建评价指标;对预先录制的初始音频数据执行预处理操作以确定测试音频数据,并根据与所述初始音频数据对应的初始文本数据确定与所述测试音频数据对应的测试文本数据;对于预先获取的每个语音识别模型,将所述测试音频数据输入所述语音识别模型以确定识别文本数据,根据所述测试文本数据和所述识别文本数据确定所述语音识别模型在评价指标的评价数据;根据多个所述评价数据对每个语音识别模型在评价指标进行排序以确定每个语音识别模型对应的总得分;选择所述总得分最高的语音识别模型作为目标语音识别模型。2.根据权利要求1所述的方法,其特征在于,所述测试音频数据,包括:变速测试音频数据;所述对预先录制的初始音频数据执行预处理操作以确定测试音频数据,包括:录制得到正常语音速度的初始音频数据;根据变速参数调整所述初始音频数据以确定所述变速测试音频数据;其中,所述变速测试音频数据的语音速度表示为V
测试
=V
初始
×
A其中,V
初始
表示正常语音速度,A表示变速参数。3.根据权利要求1所述的方法,其特征在于,所述测试音频数据,包括:变音量测试音频数据;所述对预先录制的初始音频数据执行预处理操作以确定测试音频数据,包括:确定录制得到的所述初始音频数据的当前音量;根据音量调节参数调整所述初始音频数据以确定所述变音量测试音频数据;其中,所述变音量测试音频数据的音量表示为bel
测试
=bel
初始
+db其中,bel
初始
表示所述初始音频数据的当前音量,db表示所述音量调节参数。4.根据权利要求1所述的方法,其特征在于,所述测试音频数据,包括:混合测试音频数据;所述对预先录制的初始音频数据执行预处理操作以确定测试音频数据,包括:确定噪音音频数据以及录制得到的所述初始音频数据;混合并叠加所述噪音音频数据和所述初始音频数据以确定所述混合测试音频数据。5.根据权利要求1所述的方法,其特征在于,所述初始音频数据,包括以下音频数据中的一种或多种:不同口音的音频数据、多人对话场景的音频数据或不同语言的音频数据。6.根据权利要求1所述的方法,其特征在于,所述评价指标,包括:第一字正确率;所述对于预先获取的每个语音识别模型,根据所述测试文本数据和所述识别文本数据确定所述语音识别模型在评价指标的评价数据,包括:根据所述测试文本数据和所述识别文本数据各个对应的文字位置确定所述测试文本数据中是否存在被替换的文字;
响应于所述测试文本数据中存在被替换的文字,确定被替换的文字数量;根据所述测试文本数据和所述识别文本数据各个对应的文字位置确定所述测试文本数据中是否存在被剔除的文字;响应于所述测试文本数据中存在被剔除的文字,确定被剔除的文字数量;根据所述测试文本数据和所述识别文本数据各个对应的文字位置确定所述测试文本数据中是否存在被插入的文字;响应于所述测试文本数据中存在被插入的文字,确定被插入的文字数量;确定所述测试文本数据中的总字符数,根据所述总字符数、被替换的文字数量、被剔除的文字数量以及被插入的文字数量确定第一字正确率,并将所述第一字正确率对应的量化值作为所述评价数据。7.根据权利要求6所述的方法,其特征在于,所述评价指标,包括:第二字正确率;所述对于预先获取的每个语音识别模型,根据所述测试文本数据和所述识别文本数据确定所述语音识别模型在评价指标的评价数据,包括:根据所述测试文本数据和所述识别文本数据各个对应的标点符号位置确定所述测试文本数据中是否存在被替换的标点符号;响应于所述测试文本数据中存在被替换的标点符号,确定被替换的标点符号数量;根据所述测试文本数据和所述识别文本数据各个对应的标点符号位置确定所述测试文本数据中是否存在被剔除的标点符号;响应于所述测试文本数据中存在被剔除的标点符号,确定被剔除的标点符号数量;根据所述测试文本数据和所述识别文本数据各个对应的标点符号位置确定所述测试文本数据中是否存在被插入的标点符号;响应于所述测试文本数据中存在被插入的标点符号,确定被插入的标点符号数量;根据所述总字符数、被替换的文字数量、被剔除的文字数量、被插入的文字数量、被替换的标点符号数量、被剔除的标点符号数量以及被插入的标点符号数量确定第二字正确率,并将所述第二字正确率对应的量化值作为所述评价数据。8.根据权利要求6所述的方法,其特征在于,所述评价指标,包括:第一句正确率;所述对于预先获取的每个语音识别模型,根据所述测试文本数据和所述识别文本数据确定所述语音识别模型在评价指标的评价数据,包括:确定所述测试文本数据中是否存在至少一个第一目标语句;其中,所述第一目标语句为两个相邻标点符号之间存在被替换的文字、被剔除的文字或被插入的文字的文字集合;响应于所述测试文本数据中存在至少一个第一目标语句,确定所述第一目标语句的数量;根据所述测试文本数据中两个相邻标点符号之间的文字集合确定所述测试文本数据中的语句总数;根据所述第一目标语...
【专利技术属性】
技术研发人员:徐铭驰,高峰,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。