The embodiment of the invention provides a system and a voiceprint recognition method, the realization process of this method, based on the separation characteristics of auditory speech processing after the noisy mixed noise after preprocessing, frequency cepstral coefficients and perceptual linear prediction coefficient of signal extraction, and the use of background noise in the dividing area, under the different noise conditions of frequency cepstral coefficients and perceptual linear prediction coefficients for the analysis of the characteristics of fusion, finally in the voiceprint template library of pre built, the Gauss mixed model universal background model has been completed for the integration of the characteristics of pattern matching, to achieve voiceprint recognition. The voiceprint feature recognition method combining the characteristics of human auditory system and traditional voiceprint recognition methods, from the perspective of bionics to solve the problem of noise reduction of voiceprint recognition rate, effectively improve the accuracy and robustness of the system of voiceprint recognition in noisy environment.
【技术实现步骤摘要】
一种声纹特征识别方法及系统
本专利技术涉及声音识别
,具体而言,涉及一种声纹特征识别方法及系统。
技术介绍
早在20世纪30年代,声纹识别的研究就已经在信息科研工作者中展开了。在早期研究中,人耳听辨(Aural)实验和听音识别可行性验证是声纹识别领域的重点。随着计算机科技在硬件和算法中的突破,声纹识别的研究不再仅仅局限于单一的人耳听辨。美国Bell实验室在语音识别领域长期处于领先位置,实验室成员LG.Kesta通过对语音频谱图的分析完成识别,并由他首先提出了“声纹识别”这个概念。随着科研工作者在声纹识别领域不断的探索和创新,使机器自动分析并识别人类语音信号变成可能。但是,目前已有的声纹特征识别方法在噪声环境下的识别准确率都普遍较低,系统鲁棒性差,应用效果不佳。
技术实现思路
本专利技术的目的在于提供一种声纹特征识别方法及系统,以改善上述问题。本专利技术较佳实施例提供一种声纹特征识别方法,该方法包括:对输入的原始语音信号进行预处理,所述预处理包括预加重、分帧加窗以及端点检测;对预处理后得到的含噪混合信号进行基于听觉特性的语音分离处理;提取经语音分离处理后的信号的频率倒谱系数和感知线性预测系数;利用噪声背景区分度,在不同噪声环境下对频率倒谱系数和感知线性预测系数进行分析以完成特征融合;及在预先建立的声纹特征模板库中,采用高斯混合模型-通用背景模型对已完成融合的特征进行模式匹配,实现声纹特征识别。本专利技术另一实施例提供一种声纹特征识别系统,该系统包括:预处理模块,用于对输入的原始语音信号进行预处理,所述预处理包括预加重、分帧加窗以及端点检测;语音分离模块,用 ...
【技术保护点】
一种声纹特征识别方法,其特征在于,该方法包括:对输入的原始语音信号进行预处理,所述预处理包括预加重、分帧加窗以及端点检测;对预处理后得到的含噪混合信号进行基于听觉特性的语音分离处理;提取经语音分离处理后的信号的频率倒谱系数和感知线性预测系数;利用噪声背景区分度,在不同噪声环境下对频率倒谱系数和感知线性预测系数进行分析以完成特征融合;在预先建立的声纹特征模板库中,采用高斯混合模型‑通用背景模型对已完成融合的特征进行模式匹配,实现声纹特征识别。
【技术特征摘要】
1.一种声纹特征识别方法,其特征在于,该方法包括:对输入的原始语音信号进行预处理,所述预处理包括预加重、分帧加窗以及端点检测;对预处理后得到的含噪混合信号进行基于听觉特性的语音分离处理;提取经语音分离处理后的信号的频率倒谱系数和感知线性预测系数;利用噪声背景区分度,在不同噪声环境下对频率倒谱系数和感知线性预测系数进行分析以完成特征融合;在预先建立的声纹特征模板库中,采用高斯混合模型-通用背景模型对已完成融合的特征进行模式匹配,实现声纹特征识别。2.根据权利要求1所述的声纹特征识别方法,其特征在于,对预处理后得到的含噪混合信号进行基于听觉特性的语音分离处理的步骤包括:将所述含噪混合信号进行分解,得到多个时频单元;依据语音分离线索对分解得到的所述多个时频单元进行聚类;对聚类后的待合成信号进行语音重构,输出分离后的语音。3.根据权利要求2所述的声纹特征识别方法,其特征在于,所述语音分离线索包括两耳时差和两耳声级差。4.根据权利要求2或3所述的声纹特征识别方法,其特征在于,依据语音分离线索对分解得到的所述多个时频单元进行聚类的步骤包括:依据掩蔽模型对所述多个时频单元进行二值掩码聚类,其中,fi表示第i频率通道的频率,fc表示高频与中低频间的临界频率,τ(i,j)表示第i频率通道与第j时间帧的一个分离线索,L(i,j)表示第i频率通道与第j时间帧的另一个分离线索,Tτ(i,j)和Tl(i,j)分别表示两个分离线索的阈值。5.根据权利要求2所述的声纹特征识别方法,其特征在于,对聚类后的待合成信号进行语音重构的步骤包括:对所述待合成信号进行韵律调整,所述韵律包括幅度、长度和基音;依据重构公式:对经韵律调整后的信号进行语音重构,其中,tj表示重构的同步标志,hj(n)表示窗函数,表示短时语音信号,gj表示幅度调整的权值。6.根据权利要求1所述的声纹特征识别方法,其特征在于,提取经语音分离...
【专利技术属性】
技术研发人员:徐晓东,张程,张毅,
申请(专利权)人:重庆重智机器人研究院有限公司,
类型:发明
国别省市:重庆,50
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。