声纹识别方法及系统技术方案

技术编号:40380048 阅读:38 留言:0更新日期:2024-02-20 22:18
本发明专利技术提供一种声纹识别方法及系统,所述方法包括:从输入音频数据中提取音频特征序列;通过声纹特征提取网络的帧级处理网络对所述音频特征序列进行特征变换,得到帧级信息;通过声纹特征提取网络的段级处理网络对所述帧级信息进行建模长序列之间的相关性,得到段级信息;将所述段级信息与数据库中存储的段级信息进行相似度匹配,识别所述输入音频数据对应的说话人的身份。本发明专利技术提供的声纹识别方法及系统,通过构建的声纹特征提取网络的段级处理网络对帧级信息进行建模长序列之间的相关性,能够提取出稳定的声纹特征,提高了声纹识别的准确性。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种声纹识别方法及系统


技术介绍

1、声纹识别技术是一种非接触式身份验证技术,通过获取说话人语音数据将其转换为特定的特征信息,并且与数据库预先存储的每个人对应的身份信息进行比对,从而判别出对应人员的身份。根据具体任务,可分为语义相关和语义无关的声纹识别。传统方法有模板匹配、高斯混合模型以及联合因子法等。而比较先进的方法是通过深度学习实现端到端的声纹特征提取,如d-vector、x-vector等。

2、基于传统方法在声纹特征建模上存在很大的局限性,所提取的声纹特征在鲁棒性、准确率上有极大的不足,其模型结构也比较负复杂。因此,目前主流的声纹识别方法通常是基于深度学习,通过收集大规模数据集进行训练从而获得端到端的声纹识别模型。然而,语音数据的不足以及神经网络不够完善等问题都可能使得训练出的模型的准确率降低。当前采用的神经网络架构不够完善,存在一定的不足,无法提取出稳定的声纹特征,声纹识别的准确率低。


技术实现思路

1、本专利技术提供一种声纹识别方法及系统,用以解决现有技本文档来自技高网...

【技术保护点】

1.一种声纹识别方法,其特征在于,包括:

2.根据权利要求1所述的声纹识别方法,其特征在于,通过声纹特征提取网络的帧级处理网络对所述音频特征序列进行特征变换,得到帧级信息,包括:

3.根据权利要求1所述的声纹识别方法,其特征在于,通过声纹特征提取网络的段级处理网络对所述帧级信息进行建模长序列之间的相关性,得到段级信息,包括:

4.根据权利要求1所述的声纹识别方法,其特征在于,还包括:

5.根据权利要求4所述的声纹识别方法,其特征在于,对声纹数据集中的数据进行增强处理,包括:

6.根据权利要求1所述的声纹识别方法,其特征在于,从输...

【技术特征摘要】

1.一种声纹识别方法,其特征在于,包括:

2.根据权利要求1所述的声纹识别方法,其特征在于,通过声纹特征提取网络的帧级处理网络对所述音频特征序列进行特征变换,得到帧级信息,包括:

3.根据权利要求1所述的声纹识别方法,其特征在于,通过声纹特征提取网络的段级处理网络对所述帧级信息进行建模长序列之间的相关性,得到段级信息,包括:

4.根据权利要求1所述的声纹识别方法,其特征在于,还包括:

5.根据权利要求4所述的声纹识别方法,其特征在于,对声纹数据集中的数据进行增强处理,包括:

6.根据权利要求1所述的声纹识别方法,其特征在...

【专利技术属性】
技术研发人员:邸荻冯云鹏贾晓磊张成林卓越
申请(专利权)人:中国人民解放军三二三九八部队
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1