【技术实现步骤摘要】
模型训练方法、身份识别方法、装置及电子设备
[0001]本申请属于机器学习
,具体涉及一种模型训练方法、身份识别方法、装置、电子设备及存储介质。
技术介绍
[0002]声音,作为人与生具来的能力,被视为很有前途的一种标识个人身份的特征,越来越受到重视。理论上来说,声纹就像指纹一样,很少会有两个人具有相同的声纹特征,因此,可以通过声纹来进行身份确认。在通过声纹来进行身份确认的过程中,需要对声音的声纹特征进行提取。但是,在基于相关的声纹特征提取模型提取到的声纹特征进行身份识别时,身份识别的准确性还有待提高。
技术实现思路
[0003]鉴于上述问题,本申请提出了一种模型训练方法、身份识别方法、装置、电子设备及存储介质,以实现改善上述问题。
[0004]第一方面,本申请实施例提供了一种声纹特征提取模型训练方法,所述方法包括:获取第一训练数据集,所述第一训练数据集为对训练音频数据集进行特征提取得到;将所述第一训练数据集输入到待训练模型中,获取所述待训练模型输出的声纹特征向量;将所述声纹特征向量输入到领域分类模型中,根据所述领域分类模型的输出得到当前领域分类损失函数的损失值;将所述声纹特征向量输入到说话人分类模型中,根据所述说话人分类模型的输出得到当前说话人分类损失函数的损失值;根据所述当前领域分类损失函数的损失值和所述当前说话人分类损失函数的损失值,对所述待训练模型进行当前次训练,若所述当前领域分类损失函数的损失值大于目标值,以及所述当前说话人分类损失函数收敛,则将所述待训练模型确定为声纹特征提取 ...
【技术保护点】
【技术特征摘要】
1.一种声纹特征提取模型训练方法,其特征在于,所述方法包括:获取第一训练数据集,所述第一训练数据集为对训练音频数据集进行特征提取得到;将所述第一训练数据集输入到待训练模型中,获取所述待训练模型输出的声纹特征向量;将所述声纹特征向量输入到领域分类模型中,根据所述领域分类模型的输出得到当前领域分类损失函数的损失值;将所述声纹特征向量输入到说话人分类模型中,根据所述说话人分类模型的输出得到当前说话人分类损失函数的损失值;根据所述当前领域分类损失函数的损失值和所述当前说话人分类损失函数的损失值,对所述待训练模型进行当前次训练,若所述当前领域分类损失函数的损失值大于目标值,以及所述当前说话人分类损失函数收敛,则将所述待训练模型确定为声纹特征提取模型。2.根据权利要求1所述的方法,其特征在于,将所述声纹特征向量输入到领域分类模型中,根据所述领域分类模型的输出得到当前领域分类损失函数的损失值,包括:将当前声纹特征向量输入所述领域分类模型,得到所述当前声纹特征向量的第一分类结果;根据所述当前声纹特征向量的第一分类结果和所述当前声纹特征向量得到所述当前领域分类损失函数的损失值。3.根据权利要求1所述的方法,其特征在于,所述将所述声纹特征向量输入到说话人分类模型中,根据所述说话人分类模型的输出得到当前说话人分类损失函数的损失值,包括:将当前声纹特征向量输入所述说话人分类模型,得到所述当前声纹特征向量的第二分类结果;根据所述当前声纹特征向量的第二分类结果和所述当前声纹特征向量对应的说话人标签,得到所述当前说话人分类损失函数的损失值。4.根据权利要求1所述的方法,其特征在于,所述领域分类损失函数为:其中,X
i
表示第i个输入所述待训练模型的特征向量,G
f
表示所述待训练模型的输出,G
d
表示所述领域分类模型的输出,d
i
表示第i个特征向量的加权值。5.根据权利要求1所述的方法,其特征在于,所述说话人分类损失函数为:其中,X
i
表示第i个输入所述待训练模型的特征向量,y
i
表示第i个特征向量对应的说话人标签,G
f
表示所述待训练模型的输出,G
y
表示所述说话人分类模型的输出。6.一种身份识别方法,其特征在于,所述方法包括:获取待识别用户的第一语音数据;将所述第一语音数据输入到声纹特征提取模型中,获取所述声纹特征提取模型输出的声纹特征向量;将所述声纹特征向量与预设声纹特征向量输入到身份识别模型中,得到所述身份识别
模型输出的声纹识别结果,其中,所述预设声纹特征向量为将预录入的语音数据输入到所述声纹特征提取模型中得到;基于所述声纹识别结果,确定所述待识别用户的身份识别是否成功。7.根据权利要求6所述的方法,其特征在于,所述声纹识别结果为似然分布数值,所述基于所述声纹识别结果,确定所述待识别用户的身份识别是否成功,包括:若所述似...
【专利技术属性】
技术研发人员:孟庆林,王洪斌,刘敏,陈燕丽,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。