跨信道声纹模型训练方法、识别方法、装置及可读介质制造方法及图纸

技术编号:32636943 阅读:25 留言:0更新日期:2022-03-12 18:12
本发明专利技术公开了一种跨信道声纹模型训练方法、识别方法、装置及可读介质,通过实验室采集到的不同信道的数据集分别作为注册数据集和验证数据集对声纹识别模型进行训练,再采用实际应用场景中采集到的不同信道的数据集对训练好的声纹识别模型进行微调,将来自不同信道的数据集输入微调训练好的声纹识别模型输出声纹特征,将不同信道对应的声纹特征做交叉比对并进行相似度计算,计算相似度分值的平均值和方差。在1:1声纹验证过程中,将不同信道的语音数据输入微调训练好的声纹识别模型提取声纹特征,对声纹特征进行相似度计算,并结合平均值和方差计算出最终相似度分值,根据最终相似度分值确认是否为同一个人。本发明专利技术可有效提升跨信道声纹识别准确率。升跨信道声纹识别准确率。升跨信道声纹识别准确率。

【技术实现步骤摘要】
跨信道声纹模型训练方法、识别方法、装置及可读介质


[0001]本专利技术涉及声纹识别领域,具体涉及一种跨信道声纹模型训练方法、识别方法、装置及可读介质。

技术介绍

[0002]每个人的声音都蕴涵着特有的生物特征,声纹识别是指利用说话人的声音来识别说话人的一种技术手段。声纹识别同指纹识别等技术一样具有高度的安全可靠性,可以应用在所有需要做身份识别的场合。如在刑侦、银行、证券、保险等金融领域。与传统的身份识别技术相比,声纹识别的优势在于,声纹提取过程简单、成本低、且具有唯一性、不易伪造和假冒。
[0003]在同信道声纹识别场景中,声纹识别准确率往往可以达到98%以上,等错率(EER,Equal Error Rate)也能达到0.01以下。在实际应用场景中,用户通过手机app(应用软件)注册声纹,再通过呼叫中心咨询业务。在此过程中,银行业务系统通过声纹识别来对用户身份进行认证以保障业务安全。这就涉及到,通过手机app网络信道采集的采样率为第一采样率的语音,而通过电话信道采集的采样率为第二采样率的语音,这两个语音的比对属于跨信道比对或者跨信道场本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种跨信道声纹识别模型训练方法,其特征在于,包括以下步骤:S1,获取分别从第一信道和第二信道采集到的第一数据集和第二数据集,将所述第一数据集所提取的声学特征作为注册数据集,将所述第二数据集所提取的声学特征作为验证数据集对声纹识别模型进行训练,得到第一声纹识别模型;S2,在实际应用场景中获取分别从所述第一信道和所述第二信道采集到的第三数据集和第四数据集,将所述第三数据集所提取的声学特征作为注册数据集,将所述第四数据集所提取的声学特征作为验证数据集对所述第一声纹识别模型进行微调,得到第二声纹识别模型;S3,在实际应用场景中获取分别从所述第一信道和所述第二信道采集到的N1个第五数据集和N2个第六数据集,将所述N1个第五数据集和N2个第六数据集所提取的声学特征输入所述第二声纹识别模型,得到N1个第一声纹特征和N2个第二声纹特征,将所述N1个第一声纹特征和N2个第二声纹特征进行交叉比对并计算其相似度,得到N1*N2个第一相似度分值;S4,计算所述N1*N2个第一相似度分值的平均值和方差,将所述平均值和方差作为参数固化在所述第二声纹识别模型中,得到第三声纹识别模型。2.根据权利要求1所述的跨信道声纹识别模型训练方法,其特征在于,所述声纹识别模型采用x

vector或者i

vector框架。3.根据权利要求1所述的跨信道声纹识别模型训练方法,其特征在于,所述声学特征为经过标准化处理后提取的mfcc特征。4.根据权利要求3所述的跨信道声纹识别模型训练方法,其特征在于,所述第一数据集、第三数据集和第五数据集的采样率为第一采样率,所述第二数据集、第四数据集和第六数据集的采样率为第二采样率。5.根据权利要求4所述的跨信道声纹识别模型训练方法,其特征在于,所述标准化处理过程具体包括:将采样率为第一采样率的数据降采样至采样率为第二采样率的数据;去除所有数据集的中的静音段,保留有效语音;对所述有效语音进行加噪处理;通过语音转码对所有数据集进行数据扩增;对扩增后的数据集提取mcff特征。6.一种跨信道声纹识别方法,其特征在于,包括采用权利要求1

5中任一项所述的跨信道声纹识别模型训练方法训练得到的第三声纹识别模型,包括以下步骤:获取分别从所述第一信道和所述第二信道采集到待识别的第一语音和第二语音;将所述第一语音和第二语音所对应的声学特征分别输入所述第三声纹识别模型中得到第三声纹特征和第四声纹特征;计算所述第三声纹特征和第四声纹特征的相似度,得到第二相似度分值,根据所述第二相似度分值结合所述平均值和方差计算得到最终相似度分值,基于所述最终相似度分值确定所述第一语音和第二语音对应的人是否为同一个人。7.根据权利要求6所述的跨信道声纹识别方法,其特征在于,所述根据所述第二相似度分值结合所述平均值和方差计算得到最终相似度分值,具体包括:根据以下公式计算所述最终相似度分值:
其...

【专利技术属性】
技术研发人员:叶林勇肖龙源李稀敏叶志坚
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1