语音识别模型的训练方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39244340 阅读:9 留言:0更新日期:2023-10-30 11:56
本申请涉及一种语音识别模型的训练方法、装置、计算机设备和存储介质。所述方法包括:实时获取语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集;利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型;利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型。采用本方法能够在使用过程中优化语音识别模型,进一步提高语音识别模型的准确率。一步提高语音识别模型的准确率。一步提高语音识别模型的准确率。

【技术实现步骤摘要】
语音识别模型的训练方法、装置、计算机设备和存储介质


[0001]本申请涉及人工智能
,特别是涉及一种语音识别模型的训练方法、装置、计算机设备和存储介质。

技术介绍

[0002]近年来,智能客服语音系统在国内外得到了越来越快的发展,智能语音系统起到企业和客户之间沟通桥梁的作用。
[0003]智能客服语音系统中,针对客户声音输入的智能语音识别系统是整个系统的关键。现有的方法一般是基于卷积神经网络的深度学习模型,这些语音识别模型都在训练之后模型都会固化,在使用过程中无法进行微调和优化。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够进一步提高语音识别模型的准确率的语音识别模型的训练方法、装置、计算机设备和存储介质。
[0005]第一方面,本申请提供了一种语音识别模型的训练方法。所述方法包括:
[0006]实时获取语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集;
[0007]利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型;
[0008]利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型。
[0009]在其中一个实施例中,所述获取语音客户系统中语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集,包括:
[0010]选择所述语音数据中客户的语音数据;
[0011]根据客户的语音数据的获取时间将客户的语音数据分为旧数据集和新数据集。
[0012]在其中一个实施例中,所述利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型,包括:
[0013]对所述旧数据集中的语音数据进行频谱变化,获得对应的梅尔频谱数据;
[0014]对所述梅尔频谱数据进行特征提取,获得对应的第一特征数据;
[0015]对所述第一特征数据进行降维处理,获得降维后的特征数据;
[0016]根据降维后的特征数据获得对应的输出结果;
[0017]将所述输出结果和各语言数据的标签作为损失函数的输入,并根据损失函数的结果调整初始语音识别模型中参数,并返回步骤:对所述梅尔频谱数据进行特征提取,获得对应的第一特征数据,直到所述损失函数的输出结果小于或者等于预设结果。
[0018]在其中一个实施例中,所述增量学习模型包括多级残差自适应聚合网络子模型,所述利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型,包括:
[0019]将所述新数据集中的语音数据输入至所述多级残差自适应聚合网络子模型进行特征提取,获得经过多级残差自适应聚合网络子模型提取的第二特征;
[0020]利用所述第二特征对训练后的语音识别模型进行优化,获得优化后的语音识别模型。
[0021]在其中一个实施例中,所述将所述新数据集中的语音数据输入至所述多级残差自适应聚合网络子模型进行特征提取,获得经过多级残差自适应聚合网络子模型提取的第二特征,包括:
[0022]将所述新数据集中的语音数据输入至所述多级残差自适应聚合网络子模型中第一级残差自适应聚合网络子模型的第一残差块,获得第一子特征;
[0023]将所述第一子特征和所述第一级残差自适应聚合网络子模型的第二残差块输出的特征进行聚合,获得第一聚合特征;
[0024]将所述第一聚合特征输入至所述多级残差自适应聚合网络子模型中第二残差自适应聚合网络子模型的第一残差块,获得第二子特征;
[0025]将所述第二子特征和所述第二级残差自适应聚合网络子模型的第二残差块输出的特征进行聚合,获得第二聚合特征,依次类推,直到将最后一级残差自适应聚合网络子模型的第一残差块和第二残差块输出的子特征进行聚合,获得所述第二特征。
[0026]在其中一个实施例中,所述利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型,之前包括:
[0027]计算所述新数据集中各语音数据与所述旧数据集中各语音数据的相似度;
[0028]剔除所述新数据集中所述相似度低于预设相似度的语音数据。
[0029]第二方面,本申请还提供了一种语音识别模型的训练装置。所述装置包括:
[0030]语音数据获取模块,用于获取语音客户系统中语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集;
[0031]训练模块,用于利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型;
[0032]优化模块,用于利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型。
[0033]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0034]实时获取语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集;
[0035]利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型;
[0036]利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型。
[0037]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0038]实时获取语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集;
[0039]利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型;
[0040]利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型。
[0041]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0042]实时获取语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集;
[0043]利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型;
[0044]利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型。
[0045]上述语音识别模型的训练方法、装置、计算机设备和存储介质,通过实时获取语音客户系统中语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集;利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型;利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型。通过上述方式,本申请将实时语音数据的获取时间将获得的语音数据划分为旧数据和新数据,利用旧数据集先顺利语音识别模型,再利用新数据集和增量学本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音识别模型的训练方法,其特征在于,所述方法包括:实时获取语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集;利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型;利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型。2.根据权利要求1所述的方法,其特征在于,所述获取语音客户系统中语音数据,并根据所述语音数据的获取时间将所述语音数据分为旧数据集和新数据集,包括:选择所述语音数据中客户的语音数据;根据客户的语音数据的获取时间将客户的语音数据分为旧数据集和新数据集。3.根据权利要求2所述的方法,其特征在于,所述利用所述旧数据集对初始语音识别模型进行训练,获得训练后的语音识别模型,包括:对所述旧数据集中的语音数据进行频谱变化,获得对应的梅尔频谱数据;对所述梅尔频谱数据进行特征提取,获得对应的第一特征数据;对所述第一特征数据进行降维处理,获得降维后的特征数据;根据降维后的特征数据获得对应的输出结果;将所述输出结果和各语言数据的标签作为损失函数的输入,并根据损失函数的结果调整初始语音识别模型中参数,并返回步骤:对所述梅尔频谱数据进行特征提取,获得对应的第一特征数据,直到所述损失函数的输出结果小于或者等于预设结果。4.根据权利要求1所述的方法,其特征在于,所述增量学习模型包括多级残差自适应聚合网络子模型,所述利用所述新数据集和预设的增量学习模型对训练后的语音识别模型进行优化,获得优化后的语音识别模型,包括:将所述新数据集中的语音数据输入至所述多级残差自适应聚合网络子模型进行特征提取,获得经过多级残差自适应聚合网络子模型提取的第二特征;利用所述第二特征对训练后的语音识别模型进行优化,获得优化后的语音识别模型。5.根据权利要求4所述的方法,其特征在于,所述将所述新数据集中的语音数据输入至所述多级残差自适应聚合网络子模型进行特征提取,获得经过多级残差自适应聚合网络...

【专利技术属性】
技术研发人员:杨碧云
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1