生成语音鉴别模型的连续学习方法、装置和电子设备制造方法及图纸

技术编号:37230946 阅读:8 留言:0更新日期:2023-04-20 23:13
本发明专利技术涉及一种生成语音鉴别模型的连续学习方法、装置和电子设备,生成语音鉴别模型的连续学习方法包括:获取源数据集,根据源数据集,确定第一数据模型;获取目标数据集,根据目标数据集,对第一数据模型进行梯度修正,以得到第二数据模型;对第二数据模型进行正则化修正,以得到目标数据模型。以得到目标数据模型。以得到目标数据模型。

【技术实现步骤摘要】
生成语音鉴别模型的连续学习方法、装置和电子设备


[0001]本专利技术涉及数据模型开发
,尤其涉及一种生成语音鉴别模型的连续学习方法、装置和电子设备。

技术介绍

[0002]近年来,随着深度学习的快速发展,语音转换和语音合成技术也日趋成熟,深度模型产生的生成语音已达到与真人相媲美的程度,在人机交互、智能家居、娱乐、教育等领域有广泛的应用。随着相关研究的推进,基于深度学习的生成语音检测模型在部分数据集上表现优异,但在跨数据集场景下,语音检测模型的准确率会大幅的降低。

技术实现思路

[0003]有鉴于此,本专利技术提供一种生成语音鉴别模型的连续学习方法、装置和电子设备。
[0004]具体地,本专利技术是通过如下技术方案实现的:根据本专利技术的第一方面,提供一种生成语音鉴别模型的连续学习方法,生成语音鉴别模型的连续学习方法包括:获取源数据集,根据源数据集,确定第一数据模型;获取目标数据集,根据目标数据集,对第一数据模型进行梯度修正,以得到第二数据模型;对第二数据模型进行正则化修正,以得到目标数据模型。
[0005]本专利技术提供的生成语音鉴别模型的连续学习方法的技术方案的执行主体可以为连续学习装置,还可以根据实际使用需求进行确定,在此不作具体限定。为了更加清楚地描述本专利技术提供的生成语音鉴别模型的连续学习方法,下面以连续学习装置为执行主体进行说明。
[0006]在该技术方案中,提供了一种生成语音鉴别模型的连续学习方法,连续学习装置通过源数据集,建立并训练第一数据模型,其中,源数据集为用于训练数据模型的数据集,第一数据模型为通过源数据集训练得到的数据模型,数据模型为能够识别具体数据的模型文件。在一些实施例中,源数据集可以具体为包括真实语音数据和虚拟语音数据的数据集,其中,虚拟语音数据可以为计算机合成的语音数据,真实语音数据可以为用户录制的语音数据。第一数据模型可以具体为识别语音为真实语音或者虚拟语音的数据模型。
[0007]连续学习装置获取目标数据集,通过目标数据集对第一数据模型进行再次训练,在训练第一数据模型的过程中,连续学习装置通过目标数据集,修正第一数据模型的梯度参数,进而得到第二数据模型,其中,目标数据集为应用第一数据模型的应用数据集,第二数据模型为第一数据模型修正后的数据模型,梯度参数为表示数据模型中变化率最大向量参数。在一些实施例中,目标数据集可以具体为应用级的数据集,梯度参数可以具体包括第一数据模型的梯度下降方向,第二数据模型可以具体为修正梯度下降方向的数据模型。
[0008]确定第二数据模型之后,连续学习装置对第二数据模型进行正则化修正,将第二数据模型更新为目标数据模型,其中,目标数据模型为在第二数据模型的基础上优化后的数据模型,正则化修正为对数据模型的参数进行限制的过程。
[0009]在一些实施例中,目标数据模型可以具体为能够高准确率识别真实语音和虚拟语音的数据模型,正则化修正可以具体为对数据模型的输出参数进行规则化的过程。
[0010]在一些实施例中,连续学习装置可以通过目标数据集,连续多次对第一数据模型进行数据训练,同时可以对第一数据模型进行梯度修正,得到第二数据模型,并对第二数据模型进行正则化约束,进而得到目标数据模型。
[0011]在一些实施例中,源数据集可以具体为连续学习过程中的源数据集。
[0012]在一些实施例中,目标数据集可以具体为连续学习过程中的目标数据集。
[0013]在一些实施例中,在连续学习的过程中,目标数据集会对源数据集产生灾难性遗忘,导致目标数据集对源数据集的识别准确率大幅度下降,连续学习装置通过目标数据集,优化第一数据模型,得到目标数据模型,在提高目标数据模型对于目标数据集的识别准确率的基础上,保证了目标数据集对源数据集的识别准确率。
[0014]在一些实施例中,在无法获取源数据集的情况下,连续学习装置可以只通过目标数据集,优化第一数据模型,得到目标数据模型,进而提升了目标数据模型的应用适配性。
[0015]在一些实施例中,在源数据集和目标数据集的基础上,连续学习装置可以通过其他多个数据集进行连续学习,保证目标数据模型对其他多个数据集的识别准确率,扩展了目标数据模型的应用范围。
[0016]本技术方案中的生成语音鉴别模型的连续学习方法通过目标数据集,修正第一数据模型的梯度,得到第二数据模型,并对第二数据模型进行正则化修正,确定目标数据模型,既保证了目标数据模型对于源数据集的识别准确率,又大幅度提高了目标数据模型对于源数据集目标数据集的识别准确率,进而保证了目标数据模型对于源数据集和目标数据集等不同种类数据集的数据识别能力。
[0017]根据本专利技术的第二方面,提供一种生成语音鉴别模型的连续学习装置,生成语音鉴别模型的连续学习装置包括:处理模块,用于获取源数据集,根据源数据集,确定第一数据模型;处理模块,还用于获取目标数据集,根据源数据集和目标数据集,对第一数据模型进行梯度修正,以得到第二数据模型;处理模块,还用于对第二数据模型进行正则化修正,以得到目标数据模型。
[0018]在该技术方案中,提供了一种生成语音鉴别模型的连续学习装置,处理模块通过源数据集,建立并训练第一数据模型,其中,源数据集为用于训练数据模型的数据集,第一数据模型为通过源数据集训练得到的数据模型,数据模型为能够识别具体数据的模型文件。
[0019]在一些实施例中,源数据集可以具体为包括真实语音数据和虚拟语音数据的数据集,其中,虚拟语音数据可以为计算机合成的语音数据,真实语音数据可以为用户录制的语音数据。第一数据模型可以具体为识别语音为真实语音或者虚拟语音的数据模型。
[0020]处理模块获取目标数据集,通过目标数据集对第一数据模型进行再次训练,在训练第一数据模型的过程中,处理模块通过源数据集和目标数据集,修正第一数据模型的梯度参数,进而得到第二数据模型,其中,目标数据集为应用第一数据模型的应用数据集,第二数据模型为第一数据模型修正后的数据模型,梯度参数为表示数据模型中变化率最大向量参数。
[0021]在一些实施例中,目标数据集可以具体为应用级的数据集,梯度参数可以具体包
括第一数据模型的梯度下降方向,第二数据模型可以具体为修正梯度下降方向的数据模型。
[0022]确定第二数据模型之后,处理模块对第二数据模型进行正则化修正,将第二数据模型更新为目标数据模型,其中,目标数据模型为在第二数据模型的基础上优化后的数据模型,正则化修正为对数据模型的参数进行限制的过程。
[0023]在一些实施例中,目标数据模型可以具体为能够高准确率识别真实语音和虚拟语音的数据模型,正则化修正可以具体为对数据模型的输出参数进行规则化的过程。
[0024]在一些实施例中,处理模块可以通过目标数据集,连续多次对第一数据模型进行数据训练,同时可以对第一数据模型进行梯度修正,得到第二数据模型,并对第二数据模型进行正则化约束,进而得到目标数据模型。
[0025]在一些实施例中,源数据集可以具体为连续学习本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生成语音鉴别模型的连续学习方法,其特征在于,所述生成语音鉴别模型的连续学习方法包括:获取源数据集,根据所述源数据集,确定第一数据模型;获取目标数据集,根据所述目标数据集,对所述第一数据模型进行梯度修正,以得到第二数据模型;对所述第二数据模型进行正则化修正,以得到目标数据模型。2.根据权利要求1所述的生成语音鉴别模型的连续学习方法,其特征在于,所述根据所述目标数据集,对所述第一数据模型进行梯度修正,以得到第二数据模型,具体包括:根据所述目标数据集,确定目标数据矩阵;根据所述目标数据矩阵,确定梯度修正方向;根据所述梯度修正方向,更新所述第一数据模型的梯度参数,以得到所述第二数据模型。3.根据权利要求2所述的生成语音鉴别模型的连续学习方法,其特征在于,所述根据所述目标数据集,确定目标数据矩阵,具体包括:将所述目标数据集中的数据转换为矩阵形式数据,以得到所述目标数据矩阵。4.根据权利要求1所述的生成语音鉴别模型的连续学习方法,其特征在于,所述对所述第二数据模型进行正则化修正,以得到目标数据模型,具体包括:获取所述第一数据模型的第一输出值和所述第二数据模型的第二输出值;根据所述第一输出值和所述第二输出值,更新所述第二数据模型,以得到所述目标数据模型。5.根据权利要求4所述的生成语音鉴别模型的连续学习方法,其特征在于,所述根据所述第一输出值和所述第二输出值,更新所述第二数据模型,以得到所述目标数据模型,具体包...

【专利技术属性】
技术研发人员:陶建华张晓辉易江燕
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1