对抗域自适应模型训练方法及对抗域自适应模型技术

技术编号：25990494 阅读：25 留言：0更新日期：2020-10-20 18:58

本发明专利技术公开一种对抗域自适应模型训练方法，所述对抗域自适应模型包括源域嵌入提取器、说话者判别器、目标域嵌入提取器和域判别器，所述方法包括：S10、配置所述源域嵌入提取器和所述目标域嵌入提取器之间共享部分层的参数；S20、将有标注的源域训练数据输入至所述源域嵌入提取器，所述源域嵌入提取器的输出输入至所述说话者判别器，得到说话者损失；S30、将无标注的目标域训练数据输入至所述目标域嵌入提取器，所述目标域提取器的输出和所述源域嵌入提取器的输出输入至所述域判别器，得到Wasserstein损失。在本发明专利技术提出的方法中，源域和目标域的特征提取器并不是完全相同的。这样特征提取器不同的参数部分可以解决主任务和域对抗训练任务之间的冲突问题。

全部详细技术资料下载

【技术实现步骤摘要】
对抗域自适应模型训练方法及对抗域自适应模型
本专利技术涉及人工智能
，尤其涉及一种对抗域自适应模型训练方法及对抗域自适应模型。
技术介绍
自从提出基于深度神经网络(DNN)的说话人嵌入以来，旨在验证用户在其语音段中所声称的身份的说话人验证任务已获得了显着改进。研究人员已经研究了不同的DNN架构和不同的损失函数，以增强基于DNN的说话人嵌入的辨别力。尽管用于说话人验证的DNN嵌入成功，但DNN训练通常需要大量带有说话人标签的经过标注的数据。另一方面，我们知道从一个域训练的模型的性能在应用于数据分布不相同的不同域时会急剧下降。针对每种应用场景训练特定于域的模型是一种幼稚的解决方案，为每个域收集和标记数据既耗时又非常昂贵。因此，有必要找到一种有效的方法，以将经过良好标记的源域数据集训练的现有模型快速调整到新的目标域，在该目标域中，只有弱标记或者甚至未标记的数据可用。已经提出了不同的方法来解决用于说话者验证的域自适应问题，其中最常用的一种方法是利用对抗学习使表示域不变，并减少源域数据和目标域数据之间的不匹配。失配可能来自不同的通道，噪声类型和语言等。现有技术提出使用通道对抗训练来使说话人嵌入更具通道不变性。但是，在当前的大多数工作中，来自源域和目标域的数据共享相同的特征提取器。源域数据和目标域数据一般都有着很大的差别，对源域和目标域数据使用完全相同的特征提取器提取特征，然后在使用对抗训练使得两者提取的特征分布一致，这会损害主任务的性能。
技术实现思路
本专利技术实施例提供一种对抗域自适应模型...

【技术保护点】
1.一种对抗域自适应模型训练方法，所述对抗域自适应模型包括源域嵌入提取器、说话者判别器、目标域嵌入提取器和域判别器，所述方法包括：/n配置所述源域嵌入提取器和所述目标域嵌入提取器之间共享部分层的参数；/n将有标注的源域训练数据输入至所述源域嵌入提取器，所述源域嵌入提取器的输出输入至所述说话者判别器，得到说话者损失；/n将无标注的目标域训练数据输入至所述目标域嵌入提取器，所述目标域嵌入提取器的输出和所述源域嵌入提取器的输出输入至所述域判别器，得到Wasserstein损失。/n

【技术特征摘要】
1.一种对抗域自适应模型训练方法，所述对抗域自适应模型包括源域嵌入提取器、说话者判别器、目标域嵌入提取器和域判别器，所述方法包括：
配置所述源域嵌入提取器和所述目标域嵌入提取器之间共享部分层的参数；
将有标注的源域训练数据输入至所述源域嵌入提取器，所述源域嵌入提取器的输出输入至所述说话者判别器，得到说话者损失；
将无标注的目标域训练数据输入至所述目标域嵌入提取器，所述目标域嵌入提取器的输出和所述源域嵌入提取器的输出输入至所述域判别器，得到Wasserstein损失。

2.根据权利要求1所述的方法，其中，还包括预先对所述域判别器进行多次迭代训练。

3.根据权利要求1所述的方法，其中，所述源域嵌入提取器和所述目标域嵌入提取器分别包括多个TDNN层、一个池化层和一个密集层。

4.根据权利要求3所述的方法，其中，所述配置所述源域嵌入提取器和所述目标域嵌入提取器之间共享部分层的参数包括：
通过权重正则化损失配置所述源域嵌入提取器和所述目标域嵌入提取器之间的多个层共享参数，所述多个层为所述多个TDNN层和所述密集层中的部分层。

5.根据权利要求4所述的方法，其中，所述多个层包括最靠近所述源域嵌入提取器和所述目标域嵌入提取器的输出...

【专利技术属性】
技术研发人员：钱彦旻，陈正阳，王帅，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人