声纹识别模型训练方法、声纹识别方法及相关设备技术

技术编号:31708698 阅读:31 留言:0更新日期:2022-01-01 11:11
本申请提供一种声纹识别模型训练方法、声纹识别方法及相关设备,声纹识别模型训练方法,包括:将第一声纹数据分别输入至所述教师网络和所述学生网络中,进行第N次迭代训练;所述教师网络已根据第二声纹数据训练收敛,且所述第二声纹数据的时长大于所述第一声纹数据的时长;计算所述教师网络输出的第一特征向量和所述学生网络输出的第二特征向量的第一均值向量;在所述第一均值向量对应的输出值满足第一预设条件的情况下,将进行第N次迭代训练后的待训练模型确定为声纹识别模型,所述声纹识别模型包括进行第N次迭代训练后的教师网络和学生网络。这样,提高了声纹识别模型的准确度。度。度。

【技术实现步骤摘要】
声纹识别模型训练方法、声纹识别方法及相关设备


[0001]本申请涉及声纹识别
,尤其涉及到一种声纹识别模型训练方法、声纹识别方法及相关设备。

技术介绍

[0002]声纹识别作为可信的声纹特征认证技术,在身份认证、安全核身等诸多领域和场景中都有广阔的应用前景。但是语音很容易受到各种噪声环境、情绪、身体状况等外部环境和自身因素的影响,因此,提高声纹识别准确率,有着极为重要的现实意义。当前在声纹识别模型的训练过程中,当声纹数据的时长较短时,容易导致训练得到的声纹识别模型的准确度较低。

技术实现思路

[0003]本申请实施例提供一种声纹识别模型训练方法、声纹识别方法及相关设备,以解决训练得到的声纹识别模型的准确度较低的问题。
[0004]为了解决上述技术问题,本申请是这样实现的:
[0005]第一方面,本申请实施例提供了一种声纹识别模型训练方法,所述方法包括:
[0006]将第一声纹数据分别输入至待训练模型包括的教师网络和学生网络中,进行第N次迭代训练;其中,所述N为正整数,所述教师网络已根据第二声纹数据训本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种声纹识别模型训练方法,其特征在于,所述方法包括:将第一声纹数据分别输入至待训练模型包括的教师网络和学生网络中,进行第N次迭代训练;其中,所述N为正整数,所述教师网络已根据第二声纹数据训练收敛,且所述第二声纹数据的时长大于所述第一声纹数据的时长;计算所述教师网络输出的第一特征向量和所述学生网络输出的第二特征向量的第一均值向量;在所述第一均值向量对应的输出值满足第一预设条件的情况下,将进行第N次迭代训练后的待训练模型确定为声纹识别模型,所述声纹识别模型包括进行第N次迭代训练后的教师网络和学生网络。2.根据权利要求1所述的方法,其特征在于,所述第一预设条件包括:均值向量对应的输出值与本次训练时输入至待训练模型中的声纹数据的实际值之间的差值小于第一预设值。3.根据权利要求1所述的方法,其特征在于,所述教师网络根据第二声纹数据训练收敛的实现方式有:将所述第二声纹数据输入至所述教师网络中,进行第M次迭代训练,所述M为小于所述N的正整数;在所述教师网络输出的第三特征向量满足第二预设条件的情况下,确定进行第M次迭代训练之后的教师网络收敛。4.根据权利要求3所述的方法,其特征在于,所述第二预设条件包括:特征向量对应的输出值与本次训练时输入至教师网络中的实际值之间的差值小于第二预设值。5.根据权利要求3所述的方法,其特征在于,所述第二声纹数据包括语音特征、一阶差分特征和音色信息特征中的至少一种。6.根据权利要求1所述的方法,其特征在于,输入至所述学生网络中的第一声纹数据的数量为L份,所述L为大于1的正整数;所述计算所述教师网络输出的第一特征向量和所述学生网络输出的第二特征向量的第一均值向量,包括:获取所述学生网络输出的L个第二特征向量,其中,所述第二特征向量与输入至所述学生网络中的第一声纹数据一一对应;计算L个第二特征向量的第二均值向量;获取所述教师网络输出的第一特征向量,并计算所述第一特征向量和所述第二均值向量的均值向量,以得到所述第一均值向量,其中,所述第一特征向量与输入至所述教师网络中的第一声纹数据对应。7.根据权利要求1所述的方法,其特征在于,所述教师网络和所述学生网络均为ResNet

FPN网络模型,且所述学生网络的网络层数量小于所述教师网络的网络层数量。8.一种声纹识别方法,其特征在于,应用于声纹识别模型包括的学生网络,所述学生网络与目标分类器连接,...

【专利技术属性】
技术研发人员:孟庆林蒋宁吴海英王洪斌刘敏陈燕丽
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1