说话人验证模型训练方法、电子设备和存储介质技术

技术编号：37548790 阅读：16 留言：0更新日期：2023-05-12 16:26

本发明专利技术公开说话人验证模型训练方法、电子设备和存储介质，其中，方法包括：从训练数据集的每个小批次中抽取N*M的语料数量，其中，N是说话人的数量，M是每个说话人的预料数量，将每个说话人的第M个语料作为查询集，每个说话人的其他语料作为支持集；以及使用N个二分类器，以成对比较的形式训练所述说话人验证模型，从而缓解闭集训练和开集测试的不匹配。本申请实施例的方法，通过使用多个二分类器，以成对比较的形式去训练模型，从而可以缓解闭集训练和开集测试的不匹配。基于二分类器的损失函数，相比于度量学习和多分类的方法，在Voxceleb数据集上达到了最好的效果。据集上达到了最好的效果。据集上达到了最好的效果。

全部详细技术资料下载

【技术实现步骤摘要】
说话人验证模型训练方法、电子设备和存储介质

[0001]本专利技术属于说话人验证模型训练
，尤其涉及说话人验证模型训练方法、电子设备和存储介质。

技术介绍

[0002]相关技术中，存在基于度量学习和基于多分类的损失函数。其中，基于度量学习就是训练的时候拉近相同说话人的距离，拉远不同说话人的距离。基于多分类就是使用多分类训练让模型具有区分说话人的能力。
[0003]专利技术人在实现本申请的过程中发现，上述方案的性能不是很好。

技术实现思路

[0004]本专利技术实施例提供一种说话人验证模型训练方法、电子设备和存储介质，用于至少解决上述技术问题之一。
[0005]第一方面，本专利技术实施例提供一种说话人验证模型训练方法，包括：从训练数据集的每个小批次中抽取N*M的语料数量，其中，N是说话人的数量，M是每个说话人的预料数量，将每个说话人的第M个语料作为查询集，每个说话人的其他语料作为支持集；以及使用N个二分类器，以成对比较的形式训练所述说话人验证模型，从而缓解闭集训练和开集测试的不匹配。
[0006]第二方面，提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本专利技术任一实施例说话人验证模型训练方法的步骤。
[0007]第三方面，本专利技术实施例还提供一种计算机程序产品，所述计算机程序产品包括存储在非易失性计算机可读

【技术保护点】

【技术特征摘要】
1.一种说话人验证模型训练方法，包括：从训练数据集的每个小批次中抽取N*M的语料数量，其中，N是说话人的数量，M是每个说话人的预料数量，将每个说话人的第M个语料作为查询集，每个说话人的其他语料作为支持集；使用N个二分类器，以成对比较的形式训练所述说话人验证模型，从而缓解闭集训练和开集测试的不匹配。2.根据权利要求1所述的方法，其中，在训练过程中，损失函数使用基于余弦的相似度量函数代替L2距离函数，从而将相似度转化到球面空间，更有利于后端的余弦打分。3.根据权利要求2所述的方法，在所述损失函数中引入边际惩罚，以增强类内样本的相似性，扩大类间样本的距离。4.根据权...

【专利技术属性】
技术研发人员：钱彦旻，韩冰，陈正阳，
申请(专利权)人：思必驰科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人