System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,更具体地说,涉及一种语音识别方法、模型训练方法、装置、设备及存储介质。
技术介绍
1、语音识别技术是一种将语音信号转换成文本的技术。现有的基于深度学习的语音识别系统非常依赖于训练数据的数量,高性能的语音识别系统通常需要大量的带标注语音数据来进行训练。然而,语音数据标注成本较高,获取难度较大,相比之下,无标注语音更加容易获取。
2、自监督学习是基于无标注语音数据进行语音识别模型训练的常用方式,自监督学习通常包含预训练和微调两个阶段,预训练阶段是通过无标注语音数据集对语音识别模型进行自监督训练,得到预训练的语音识别模型;微调阶段则是利用少量有标注的语音数据对预训练的语音识别模型进行微调,得到最终的语音识别模型。
3、目前,基于自监督学习训练得到的语音识别模型的识别准确率较低,因此,如何提高语音识别模型的识别准确率成为亟待解决的技术问题。
技术实现思路
1、有鉴于此,本申请提供了一种语音识别方法、模型训练方法、装置、设备及存储介质,以提高语音识别模型的识别准确率。
2、为了实现上述目的,现提出的方案如下:
3、一种语音识别模型训练方法,包括:
4、利用无标注语音数据集对语音识别模型进行第一轮自监督预训练,得到第一预训练的语音识别模型;
5、将所述无标注语音数据集中的无标注语音数据输入所述第一预训练的语音识别模型,得到所述第一预训练的语音识别模型的目标中间层输出的各个无标注语音数据的隐层特征序列;<
...【技术保护点】
1.一种语音识别模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于各个无标注语音数据的隐层特征序列确定各个无标注语音数据的至少两个第一类伪标签,包括:
3.根据权利要求2所述的方法,其特征在于,对于所述任一无标注语音数据的第一伪标签和第二伪标签,如果所述第一伪标签对应的第一聚类数小于所述第二伪标签对应的第二聚类数,则所述第一伪标签用于确定所述第一预训练的语音识别模型的第一网络层的自监督损失,所述第二伪标签用于确定所述第一预训练的语音识别模型的第二网络层的自监督损失;
4.根据权利要求2所述的方法,其特征在于,所述利用无标注语音数据集对语音识别模型进行第一轮自监督预训练,包括:
5.根据权利要求1所述的方法,其特征在于,所述利用所述无标注语音数据集,以及无标注语音数据的至少两个第一类伪标签对所述第一预训练的语音识别模型进行第二轮自监督预训练,包括:
6.根据权利要求5所述的方法,其特征在于,所述以基于至少两个目标层级的隐层特征序列确定的第一类伪标签趋近于所述目标层级的第一类伪标签为目标,对
7.根据权利要求5所述的方法,其特征在于,对所述掩码特征序列进行多个层级的隐层特征提取,包括:
8.根据权利要求7所述的方法,其特征在于,所述对所述掩码特征序列进行多个层级的基于自注意力的隐层特征提取,包括:
9.根据权利要求8所述的方法,其特征在于,所述多个自注意力头中的第一自注意力头和第二自注意力头的自注意力范围是隐层特征序列的局部范围;其中,
10.一种语音识别方法,其特征在于,包括:
11.一种语音识别模型训练装置,其特征在于,包括:
12.一种语音处理设备,其特征在于,包括存储器和处理器;
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-9中任一项所述的语音识别模型训练方法,和/或,如权利要求10所述的语音识别方法的各个步骤。
...【技术特征摘要】
1.一种语音识别模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于各个无标注语音数据的隐层特征序列确定各个无标注语音数据的至少两个第一类伪标签,包括:
3.根据权利要求2所述的方法,其特征在于,对于所述任一无标注语音数据的第一伪标签和第二伪标签,如果所述第一伪标签对应的第一聚类数小于所述第二伪标签对应的第二聚类数,则所述第一伪标签用于确定所述第一预训练的语音识别模型的第一网络层的自监督损失,所述第二伪标签用于确定所述第一预训练的语音识别模型的第二网络层的自监督损失;
4.根据权利要求2所述的方法,其特征在于,所述利用无标注语音数据集对语音识别模型进行第一轮自监督预训练,包括:
5.根据权利要求1所述的方法,其特征在于,所述利用所述无标注语音数据集,以及无标注语音数据的至少两个第一类伪标签对所述第一预训练的语音识别模型进行第二轮自监督预训练,包括:
6.根据权利要求5所述的方法,其特征在于,所述以基于至少两个目标层级...
【专利技术属性】
技术研发人员:刘谭,万根顺,潘嘉,刘聪,熊世富,高建清,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。