声纹识别模型训练方法、声纹识别方法及相关设备技术

技术编号:31746806 阅读:8 留言:0更新日期:2022-01-05 16:26
本申请提供一种声纹识别模型训练方法、声纹识别方法及相关设备,声纹识别模型训练方法,包括:将声纹数据依次输入至待训练模型进行多次迭代训练,得到声纹识别模型;其中,所述待训练模型包括L层网络层,L为大于1的整数;在第N次的迭代训练的过程中,包括以下步骤:将所述声纹数据依次经过L层所述网络层进行特征映射,输出声纹向量;在所述声纹向量对应的输出值满足预设条件的情况下,将经过第N次的迭代训练之后的待训练模型确定为声纹识别模型,其中,N为正整数。这样,提高了对样本的利用率,且提高了训练得到的声纹识别模型的准确度。提高了训练得到的声纹识别模型的准确度。提高了训练得到的声纹识别模型的准确度。

【技术实现步骤摘要】
声纹识别模型训练方法、声纹识别方法及相关设备


[0001]本申请涉及声纹识别
,尤其涉及到一种声纹识别模型训练方法、声纹识别方法及相关设备。

技术介绍

[0002]声纹识别作为可信的声纹特征认证技术,在身份认证、安全核验等诸多领域和场景中都有广阔的应用前景。但是语音很容易受到各种噪声环境、情绪、身体状况等外部环境和自身因素的影响,因此,提高声纹识别准确率,有着极为重要的现实意义。当前在声纹识别模型的训练过程中,对样本数据的利用率较低,从而导致训练得到的声纹识别模型的准确度较低。

技术实现思路

[0003]本申请实施例提供一种声纹识别模型训练方法、声纹识别方法及相关设备,以解决训练得到的声纹识别模型的准确度较低的问题。
[0004]为了解决上述技术问题,本申请是这样实现的:
[0005]第一方面,本申请实施例提供了一种声纹识别模型训练方法,包括:
[0006]将声纹数据依次输入至待训练模型进行多次迭代训练,得到声纹识别模型;
[0007]其中,所述待训练模型包括L层网络层,L为大于1的整数;在第N次的迭代训练的过程中,包括以下步骤:
[0008]将所述声纹数据依次经过L层所述网络层进行特征映射,输出声纹向量;
[0009]在所述声纹向量对应的输出值满足预设条件的情况下,将经过第N次的迭代训练之后的待训练模型确定为声纹识别模型,其中,N为正整数。
[0010]可以看出,本实施例中,将声纹数据依次经过L层网络层进行特征映射,输出声纹向量,即对样本依次进行了多次特征映射,提高了对样本的利用率,同时,由于后一层网络层进行特征映射得到的特征向量需要基于前一层网络层输出的特征向量,这样,通过L层网络层的层层特征映射,可以得到多种特征向量,而训练得到的声纹识别模型可以对上述多种特征向量均能进行识别,从而提高了最终训练得到的声纹识别模型对声纹数据识别的准确度。另外,由于通过L层网络层的层层特征映射,可以使得声纹数据转化为声纹向量,而声纹向量更容易且更准确的被声纹识别模型所识别,从而进一步提高了最终训练得到的声纹识别模型对声纹识别的准确度。
[0011]第二方面,本申请实施例提供了一种声纹识别方法,所述方法包括:
[0012]获取待识别用户的目标声纹数据;
[0013]将所述目标声纹数据输入至声纹识别模型包括的L层网络层进行特征映射,输出目标声纹向量,所述L为大于1的整数;
[0014]根据所述目标声纹向量进行声纹识别。
[0015]可以看出,在本申请实施例中,将目标声纹数据输入至声纹识别模型包括的L层网
络层进行特征映射,输出目标声纹向量,这样,通过L层网络层的层层特征映射,可以得到多种特征向量,而声纹识别模型可以对上述多种特征向量均能进行识别,从而提高了声纹识别模型对声纹数据识别的准确度。另外,由于通过L层网络层的层层特征映射,可以使得目标声纹数据转化为目标声纹向量,而目标声纹向量更容易且更准确的被声纹识别模型所识别,从而进一步提高了声纹识别模型对目标声纹识别的准确度。
[0016]第三方面,本申请实施例还提供一种声纹识别模型训练装置,包括:
[0017]训练模块,用于将声纹数据依次输入至待训练模型进行多次迭代训练,得到声纹识别模型;
[0018]其中,所述待训练模型包括L层网络层,L为大于1的整数;在第N次的迭代训练的过程中,包括以下步骤:
[0019]将所述声纹数据依次经过L层所述网络层进行特征映射,输出声纹向量;
[0020]在所述声纹向量对应的输出值满足预设条件的情况下,将经过第N次的迭代训练之后的待训练模型确定为声纹识别模型,其中,N为正整数。
[0021]第四方面,本申请实施例还提供一种声纹识别装置,包括:
[0022]获取模块,用于获取待识别用户的目标声纹数据;
[0023]输出模块,用于将所述目标声纹数据输入至声纹识别模型包括的L层网络层进行特征映射,输出目标声纹向量,所述L为大于1的整数;
[0024]声纹识别模块,用于根据所述目标声纹向量进行声纹识别。
[0025]第五方面,本申请实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述声纹识别模型训练方法或者声纹识别方法中的步骤。
[0026]第六方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述声纹识别模型训练方法或者声纹识别方法中的步骤。
附图说明
[0027]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0028]图1是本申请实施例提供的一种声纹识别模型训练方法的流程图;
[0029]图2是本申请实施例提供的一种待训练模型的结构示意图;
[0030]图3是本申请实施例提供的另一种待训练模型的结构示意图;
[0031]图4是本申请实施例提供的一种声纹识别方法的流程图;
[0032]图5是本申请实施例提供的一种声纹识别模型训练装置的结构示意图;
[0033]图6是本申请实施例提供的一种声纹识别装置的结构示意图;
[0034]图7是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0035]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0036]参见图1,图1是本申请实施例提供的声纹识别模型训练方法的流程图,如图1所示,包括以下步骤:
[0037]步骤101、将声纹数据依次输入至待训练模型进行多次迭代训练,得到声纹识别模型。
[0038]其中,所述待训练模型包括L层网络层,L为大于1的整数;在第N次的迭代训练的过程中,包括以下步骤:将所述声纹数据依次经过L层所述网络层进行特征映射,以输出声纹向量;在所述声纹向量对应的输出值满足预设条件的情况下,将经过第N次的迭代训练之后的待训练模型确定为声纹识别模型,其中,N为正整数。
[0039]其中,声纹数据例如可以是声纹特征向量。声纹数据的获取方式在此不做限定,例如:声纹数据可以从样本池中直接获取得到,即声纹数据为样本池中预先存在的声纹数据;另外,声纹数据也可以对音频进行提取得到。
[0040]另外,还可以对样本池中的样本数据进行数据扩增,数据扩增包括加噪声,加快语速,增加数据扰动等方式中的至少一种。
[0041]另外,上述数据扩增之后本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种声纹识别模型训练方法,其特征在于,包括:将声纹数据依次输入至待训练模型进行多次迭代训练,得到声纹识别模型;其中,所述待训练模型包括L层网络层,L为大于1的整数;在第N次的迭代训练的过程中,包括以下步骤:将所述声纹数据依次经过L层所述网络层进行特征映射,输出声纹向量;在所述声纹向量对应的输出值满足预设条件的情况下,将经过第N次的迭代训练之后的待训练模型确定为声纹识别模型,N为正整数。2.根据权利要求1所述的方法,其特征在于,所述L层网络层包括:依次连接的第一网络层、第二网络层、第三网络层和第四网络层;所述将所述声纹数据依次经过L层所述网络层进行特征映射,输出声纹向量,包括:将所述声纹数据输入至所述第一网络层中进行特征映射,输出第一特征向量;将所述第一特征向量输入至所述第二网络层中进行特征映射,输出第二特征向量;将所述第二特征向量输入至所述第三网络层中进行特征映射,输出第三特征向量;将所述第三特征向量输入至所述第四网络层中进行特征映射,输出所述声纹向量;其中,所述第一特征向量、所述第二特征向量、所述第三特征向量和所述声纹向量的维度依次递增。3.根据权利要求2所述的方法,其特征在于,所述第一网络层、所述第二网络层、所述第三网络层和所述第四网络层均包括相互连接的线性层和block块。4.根据权利要求3所述的方法,其特征在于,所述第一网络层、所述第二网络层、所述第三网络层和所述第四网络层包括的block块的数量均为多个。5.根据权利要求2所述的方法,其特征在于,所述L层网络层还包括:融入层,所述融入层与所述第一网络层连接;所述将所述声纹数据输入至所述第一网络层中进行特征映射,输出第一特征向量之前,所述方法还包括:将预先获取的待训练特征输入至所述融入层进行特征提取,得到所述声纹数据,其中,所述待训练特征的维度大于所述声纹数据的维度。6.根据权利要求1所述的方法,其特征在于,所述预设条件包括:声纹向量对应的输出值与声纹数据对应的实际值的差值位于预设范围内。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述声纹数据为fbank80特征。8.一种声纹识别方法,其特征在于,所述方法包括:获取待识别用户的目标声纹数据;将所述目标声纹数据输入至声纹识别模型包括的L层网络层进行特征映射,...

【专利技术属性】
技术研发人员:孟庆林蒋宁吴海英王洪斌刘敏陈燕丽
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1