【技术实现步骤摘要】
一种语音识别模型训练方法、语音识别方法、装置
本专利技术涉及机器学习技术,尤其涉及一种语音识别模型训练方法、语音识别方法、装置、电子设备及存储介质。
技术介绍
随着机器学习技术的发展,机器学习可以通过BERT(BidirectionalEncoderRepresentationsfromTransformers,源于Transformers的双向编码器)机制实现,在使用BERT对应的模型对语音数据进行处理的过程中,对于媒资类场景的指令识别中,由于用户语句较为复杂,交互成功率较低,影响用户的使用体验。因此,在媒资类场景下对用户意图识别精度要求更高,智能设备需要懂得如何准确地响应用户的语音指令语句。
技术实现思路
有鉴于此,本专利技术实施例提供一种语音识别模型训练方法、语音识别方法、装置、电子设备及存储介质能够使得语音识别模型的泛化能力更强,提升语音识别模型的训练精度,使得语音识别模型能够适应媒资类的使用场景,避免媒资类语句中的关联信息对语音识别模型的识别结果的影响。本专利技术实施例的技术方案是这样实 ...
【技术保护点】
1.一种语音识别模型训练方法,其特征在于,所述方法包括:/n获取训练样本集合,其中,所述训练样本集合包括与语音识别模型相匹配的经过实体标记的不同语音样本;/n通过所述语音识别模型对所述训练样本集合进行处理,确定所述语音识别模型中的实体边界抽取网络的初始参数;/n基于所述实体边界抽取网络的初始参数,通过所述语音识别模型对所述训练样本集合进行处理,确定所述实体边界抽取网络对应的更新参数;/n根据所述实体边界抽取网络对应的更新参数,通过所述训练样本集合对所述语音识别模型的实体边界抽取网络的参数进行迭代更新,以实现对所述训练样本集合中的语音样本进行实体边界抽取;/n通过所述语音识别 ...
【技术特征摘要】
1.一种语音识别模型训练方法,其特征在于,所述方法包括:
获取训练样本集合,其中,所述训练样本集合包括与语音识别模型相匹配的经过实体标记的不同语音样本;
通过所述语音识别模型对所述训练样本集合进行处理,确定所述语音识别模型中的实体边界抽取网络的初始参数;
基于所述实体边界抽取网络的初始参数,通过所述语音识别模型对所述训练样本集合进行处理,确定所述实体边界抽取网络对应的更新参数;
根据所述实体边界抽取网络对应的更新参数,通过所述训练样本集合对所述语音识别模型的实体边界抽取网络的参数进行迭代更新,以实现对所述训练样本集合中的语音样本进行实体边界抽取;
通过所述语音识别模型对所述训练样本集合进行处理,确定所述语音识别模型中的实体多任务分类网络的初始参数;
基于所述实体多任务分类网络的初始参数,通过所述语音识别模型对所述训练样本集合进行处理,确定所述实体多任务分类网络对应的更新参数;
根据所述实体多任务分类网络对应的更新参数,通过所述实体边界抽取网络的处理结果对所述实体多任务分类网络的参数进行迭代更新,以实现通过所述语音识别模型对使用环境中的不同语音信息进行处理。
2.根据权利要求1所述的方法,其特征在于,所述基于所述实体边界抽取网络的初始参数,通过所述语音识别模型对所述训练样本集合进行处理,确定所述实体边界抽取网络对应的更新参数,包括:
将所述训练样本集合中不同语句样本,代入由所述语音识别模型的实体边界抽取网络的编码器和解码器构成的自编码网络对应的损失函数;
确定所述损失函数满足第一收敛条件时对应所述实体边界抽取网络的编码器的参数和相应的解码器参数作为所述实体边界抽取网络的更新参数。
3.根据权利要求2所述的方法,其特征在于,所述根据所述实体边界抽取网络对应的更新参数,通过所述训练样本集合对所述语音识别模型的实体边界抽取网络的参数进行迭代更新,以实现对所述训练样本集合中的语音样本进行实体边界抽取,包括:
确定所述语音识别模型中实体边界抽取网络的编码器和解码器构成的自编码网络对应的迭代收敛条件;
基于所述实体边界抽取网络对应的更新参数,对所述实体边界抽取网络的编码器参数和解码器参数进行迭代更新,
直至所述实体边界抽取网络的编码器和解码器构成的自编码网络对应的损失函数满足对应的收敛条件并能够对所述训练样本集合中的语音样本进行实体边界抽取。
4.根据权利要求1所述的方法,其特征在于,所述基于所述实体多任务分类网络的初始参数,通过所述语音识别模型对所述训练样本集合进行处理,确定所述实体多任务分类网络对应的更新参数,包括:
将所述训练样本集合中不同语句样本以及所述实体边界抽取网络的输出结果,代入由所述语音识别模型的实体多任务分类网络的分类器子网络对应的损失函数;
确定所述损失函数满足第二收敛条件时对应所述实体多任务分类网络的分类器网络的参数作为所述实体多任务分类网络的更新参数。
5.根据权利要求4所述的方法,其特征在于,所述根据所述实体多任务分类网络对应的更新参数,通过所述实体边界抽取网络的处理结果对所述实体多任务分类网络的参数进行迭代更新,以实现通过所述语音识别模型对使用环境中的不同语音信息进行处理,包括:
确定所述实体多任务分类网络的分类器子网络对应的迭代收敛条件;
根据所述训练样本集合中不同语句样本以及所述实体边界抽取网络的输出结果,对所述实体多任务分类网络的分类器子网络参数进行迭代更新,
直至所述实体多任务分类网络的分类器子网络对应的损失函数满足对应的迭代收敛条件。
6.一种语音识别方法,其特征在于,所述方法包括:
获取语音指令信息,并将所述语音指令转换为相应的可识别文本信息;
通过语音识别模型的实体边界抽取网络,确定与可识别文本信息所对应的至少一个候选媒资类实体;
通过所述语音识别模型的实体多任务分类网络,根据所述至少一个候选媒资类实体,确定与所述候选媒资类实体相匹配的拼接特征向量以及所述候选媒资类实体中的不同类型实体的被选取概率;
通过所述语音识别模型的实体多任务分类网络,根据所述候选媒资类实体中的不同类型实体的被选取概率,以及与文本内容所对应的语句向量触发相应的业务进程,以实现完成与所述语音指令信息相对应的任务,
其中,所述语音识别模型基于如权利要求1至5任一项所述的方法训练得到。
7.根据权利要求6所述的方法,其特征在于,所述获取语音指令信息,并将所述语音指令转换为相应的可识别文本信息,包括:
根据所述语音指令的文本内容所携带的文本参数信息,触发相应的分词库;
通过所触发的分词库的单词词典对所述语音指令对应的文本内容进行分词处理,形成不同的词语级特征向量;
对所述不同的词语级特征向量进行除噪处理,形成与所述文本内容相对应的词语级特征向量集合作为相应的可识别文本信息。
8.根据权利要求6所述的方法,其特征在于,所述通过语音识别模型的实体边界抽取网络,确定与可识别文本信息所对应的至少一个候选媒资类实体,包括:
基于所述语音识别模型的实体边界抽取网络,确定所述可识别文本信息对应的词单元;
基...
【专利技术属性】
技术研发人员:王明,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。