一种基于孪生神经网络的声纹比对方法技术

技术编号:24760278 阅读:88 留言:0更新日期:2020-07-04 10:07
本发明专利技术公开了一种基于孪生神经网络的声纹比对方法,涉及声纹识别技术领域。本发明专利技术利用已经标注过说话人身份的语音数据,进行快速傅里叶变换,得到对应语谱图作为孪生神经网络输入;组成样本对,并给样本对配上是否来自同一个人的标签;以对比损失函数为训练准则,训练孪生神经网络声纹比对模型;在声纹比对系统中,通过训练得到的孪生神经网络模型提取表示说话人身份的声纹特征向量,并和数据库中注册的人的声纹特征向量进行相似度量,验证说话人的身份,降低环境的影响,提高声纹识别的准确率。

A method of voiceprint comparison based on twin neural network

【技术实现步骤摘要】
一种基于孪生神经网络的声纹比对方法
本专利技术属于声纹识别
,特别是涉及一种基于孪生神经网络的声纹比对方法。
技术介绍
声纹特征是生物特征的一种,每个人具有固有的特征。声纹识别技术是仅次于指纹识别、人脸识别和掌纹的生物识别技术,在识别领域具有广泛的研究和应用。之前研究者所提出的声纹特征大多是基于语音的韵律特征和音质特征,均为人工设计的特征,系统的鲁棒性不高,很容易受到环境的影响。现提供一种基于孪生神经网络的声纹比对方法,提高声纹识别的准确率。
技术实现思路
本专利技术的目的在于提供一种基于孪生神经网络的声纹比对方法,通过基于孪生神经网络的声纹比对方法,提高声纹识别的准确率。为解决上述技术问题,本专利技术是通过以下技术方案实现的:本专利技术为一种基于孪生神经网络的声纹比对方法,包括以下步骤:SS01:利用已经标注过说话人身份的语音数据,进行快速傅里叶变换,得到对应语谱图作为孪生神经网络输入;SS02:组成样本对,并给样本对配上是否来自同一个人的标签;r>SS03:以对比本文档来自技高网...

【技术保护点】
1.一种基于孪生神经网络的声纹比对方法,其特征在于,包括以下步骤:/nSS01:利用已经标注过说话人身份的语音数据,进行快速傅里叶变换,得到对应语谱图作为孪生神经网络输入;/nSS02:组成样本对,并给样本对配上是否来自同一个人的标签;/nSS03:以对比损失函数为训练准则,训练孪生神经网络声纹比对模型;/nSS04:在声纹比对系统中,验证说话人的身份,验证步骤如下:/nS041:采集语音信号;/nS042:进行快速傅里叶变换,得到语谱图;/nS043:所述语谱图输入训练完成的孪生神经网络声纹比对模型中得到对应的声纹特征;/nS044:所述声纹特征和数据库中注册的人的声纹特征向量进行相似度量,...

【技术特征摘要】
1.一种基于孪生神经网络的声纹比对方法,其特征在于,包括以下步骤:
SS01:利用已经标注过说话人身份的语音数据,进行快速傅里叶变换,得到对应语谱图作为孪生神经网络输入;
SS02:组成样本对,并给样本对配上是否来自同一个人的标签;
SS03:以对比损失函数为训练准则,训练孪生神经网络声纹比对模型;
SS04:在声纹比对系统中,验证说话人的身份,验证步骤如下:
S041:采集语音信号;
S042:进行快速傅里叶变换,得到语谱图;
S043:所述语谱图输入训练完成的孪生神经网络声纹比对模型中得到对应的声纹特征;
S044:所述声纹特征和数据库中注册的人的声纹特征向量进行相似度量,验证说话人的身份。


2.根据权利要求1所述的一种基于孪生神经网络的声纹比对方法,其特征在于,所述孪生神经网络声纹比对模型的训练包括如下步骤:
S031:对标注过说话人身份的语音数据进行快速傅里叶变换得到语谱图;
S032:语谱图组成样本对(x1,x2,y),并给样本对配上是否来自同一个人的标签;其中,y=1表示语谱图x1和x2来自同一个人,y=0表示语谱图x1和x2来自不同人;
S033:搭建孪生神经网络声纹比对模型,并初始化模型各层参数;其中,孪生神经网络为两个结构相同并共享网络参数的神经网络,每个网络分别接收语谱图样本对中的一个样本;
S034:随机采样训练样本对并进行前向运算,使用对比损失函数为损失函数并计算损失;
S035:采样随机梯度下降法误差反向传播算法对模型...

【专利技术属性】
技术研发人员:罗世操
申请(专利权)人:杭州雄迈集成电路技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1