自监督说话人模型训练方法、电子设备和存储介质技术

技术编号：34051203 阅读：68 留言：0更新日期：2022-07-06 15:51

本发明专利技术公开自监督说话人模型训练方法、电子设备和存储介质，其中，一种自监督说话人模型训练方法，包括：对每一轮训练，计算当前轮所有训练数据的损失值，对所述所有训练数据的损失使用高斯混合模型建模得到动态阈值；基于当前训练数据的损失值与所述动态阈值的关系对所述当前训练数据进行筛选；使用筛选后的训练数据进行所述说话人模型训练。本申请的方法采用高斯混合模型动态模拟损失分布，并使用估计的动态阈值自动区分可靠和不可靠标签。在进一步的实施例中，为了更好地利用不可靠的数据，而不是直接丢弃它们，本申请实施例用模型预测来进行标签校正以纠正不可靠的标签。来进行标签校正以纠正不可靠的标签。来进行标签校正以纠正不可靠的标签。

Self supervised speaker model training method, electronic equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
自监督说话人模型训练方法、电子设备和存储介质

[0001]本专利技术属于模型训练
，尤其涉及自监督说话人模型训练方法、电子设备和存储介质。

技术介绍

[0002]目前自监督说话人验证主要分为两个阶段，第一个阶段使用对比学习去训练一个说话人特征提取器。第二阶段，利用这个提取器提取数据中的说话人特征，聚类生成伪标签，再利用伪标签去训练一个新的说话人特征提取器。第二阶段重复迭代几次，就能达到很不错的效果。
[0003]相关技术中，存在不使用损失门的自监督说话人验证和使用固定阈值损失门的自监督说话人验证。
[0004]一方面，不使用损失门的自监督说话人验证在第二阶段的训练过程中，使用全部数据的伪标签进行训练，专利技术人发现，对于不使用损失门的自监督说话人验证，大量的低质量伪标签会损害模型的性能，不适用损失门无法筛选掉低质量数据。
[0005]另一方面，使用固定阈值损失门认为数据有一些伪标签是错误的，损失小的数据伪标签更可靠。通过设计一个固定阈值损失门筛选出来损失比较小的，提高训练数据的标签质量，从而提升...

【技术保护点】

【技术特征摘要】
1.一种自监督说话人模型训练方法，包括：对每一轮训练，计算当前轮所有训练数据的损失值，对所述所有训练数据的损失值使用高斯混合模型建模得到动态阈值；基于当前训练数据的损失值与所述动态阈值的关系对所述当前训练数据进行筛选；使用筛选后的训练数据进行所述说话人模型训练。2.根据权利要求1所述的方法，其中，所述基于所述训练数据的损失值与所述动态阈值的关系对所述训练数据进行筛选包括：判断当前训练数据的损失值是否大于所述动态阈值；若所述当前训练数据的损失值大于所述动态阈值，使用所述说话人模型的输出对所述当前训练数据进行标签校正，使用标签校正后的训练数据进行所述说话人模型训练；若所述当前训练数据的损失值不大于所述动态阈值的，将所述当前训练数据直接用于所述说话人模型的训练。3.根据权利要求2所述的方法，其中，所述使用所述说话人模型的输出对所述当前训练数据进行标签校正包括：判断所述当前训练数据对应的所述说话人模型的输出的预测后验概率是否大于预设概率阈值；若所述当前训练数据对应的所述说话人模型的输出的预测后验概率大于预设概率阈值，使用所述说话人模型的输出替换所述当前训练数据的标签用于训练；若所述当前训练数据对应的所述说话人模型的输出的预测后验概率不大于所述预设概率阈值，丢弃所述当前训练数据。4.根据权利要求1所述的方法，其中，所述对所述所有训练数...

【专利技术属性】
技术研发人员：钱彦旻，韩冰，陈正阳，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人