【技术实现步骤摘要】
一种基于WT的声纹识别方法及系统
本专利技术涉及声纹识别的
,尤其涉及一种基于WT的声纹识别方法及系统。
技术介绍
语音作为人与人之间实现信息交互的最直接的、最常用的和最便捷的载体,承载和传达着各种信息资源,在人机交互和信息传递中发挥着重大作用。但由于现实生活中有太多噪声的干扰,利用声纹识别出来的语音质量比较差,不容易被人们理解,也会使得人机设备难以获得准确的信息,如何有效完成声纹识别任务成为当前研究的热门话题。在现有声纹识别技术中,只注重于去噪后语音的信噪比,而没有注意去噪语音的整体质量。这些声纹识别技术有可能把语音信号较弱部分当作噪声去除了,使得在去除背景噪声同时,有用语音信号的成分也受到了损伤。这样一来,去噪处理后的语音信号与去噪前的信号相比较,听觉质量可能没有本质上的提升,甚至出现倒退。同时在语音特征参数领域中,被广泛使用的特征有:MFCC、感知线性预测系数和感知对数面积比系数。这些特征在纯净环境下可以取得良好的识别准确率,但并不能有效地适应噪声环境,尤其是10dB以下的噪音条件下,它们的性能会随着信噪比的降低而降低。鉴于此,如何有效地对声纹进行去噪,并提取能适应噪声环境的声纹特征以进行声纹识别,成为本领域技术人员亟待解决的问题。
技术实现思路
本专利技术提供一种基于WT(wavelettransform,小波变换)的声纹识别方法,通过利用基于小波变换的去噪算法对声纹进行降噪处理,并对现有声纹特征提取算法进行改进,利用改进的声纹特征提取算法进行声纹特征的提取和 ...
【技术保护点】
1.一种基于WT的声纹识别方法,其特征在于,所述方法包括:/n采用麦克风阵列对待识别声纹信号进行采集;/n利用基于相位变换的声源分离算法对待识别声纹信号进行滤波处理;/n利用基于小波阈值的去噪算法对经滤波处理的声纹信号进行降噪处理,得到降噪后的声纹信号;/n对降噪后的待识别声纹信号进行预加重和加窗的预处理;/n利用基于毛细胞函数的声纹特征提取算法提取经预处理的声纹信号的声纹特征,得到待识别声纹信号的声纹特征;/n利用能量算子提取声纹特征中的能量参数,并利用对数似然比算法进行声纹的识别。/n
【技术特征摘要】
1.一种基于WT的声纹识别方法,其特征在于,所述方法包括:
采用麦克风阵列对待识别声纹信号进行采集;
利用基于相位变换的声源分离算法对待识别声纹信号进行滤波处理;
利用基于小波阈值的去噪算法对经滤波处理的声纹信号进行降噪处理,得到降噪后的声纹信号;
对降噪后的待识别声纹信号进行预加重和加窗的预处理;
利用基于毛细胞函数的声纹特征提取算法提取经预处理的声纹信号的声纹特征,得到待识别声纹信号的声纹特征;
利用能量算子提取声纹特征中的能量参数,并利用对数似然比算法进行声纹的识别。
2.如权利要求1所述的一种基于WT的声纹识别方法,其特征在于,所述采用麦克风阵列对声纹信号进行采集,包括:
采用麦克风阵列对待识别声纹信号进行采集,其中所采集到的第i个通道信号为xi(t),它是由J个未知信号源sj(t)卷积混合而成的带噪语音信号,所述卷积混合公式为:
其中:
a(t)为冲激响应;
sj(t)表示第j个未知信号源;
J为未知信号源的个数;
bi(t)为噪音信号;
xi(t)为所采集到的第i个通道信号;
t表示离散时间。
3.如权利要求2所述的一种基于WT的声纹识别方法,其特征在于,所述利用基于相位变换的声源分离算法对待识别声纹信号进行滤波处理,包括:
1)计算任意两个待识别声纹信号的互相关关系:
其中:
x1(t),x2(t)为所采集的任意两个待识别声纹信号;
α表示声音从声源传播到麦克风的衰减;
s表示未知信号源发出的信号;
τ表示声音从声源传播到两个麦克风的时间;
2)由互相关关系与互频率谱的关系可知:
其中:
为麦克风接收信号x1(t)和x2(t)的互功率谱;
ω表示功率相位;
3)在频域对功率谱进行加权处理,实现对待识别声纹信号的滤波处理,所述加权公式为:
其中:
表示相位加权函数;
X1(ω),X2(ω)表示由傅里叶变换得到的两麦克风接收信号的功率谱;
为麦克风接收信号x1(t)和x2(t)的互功率谱;
ω表示功率相位。
4.如权利要求3所述的一种基于WT的声纹识别方法,其特征在于,所述利用基于小波阈值的去噪算法对经滤波处理的声纹信号进行降噪处理,包括:
1)利用低通/高通滤波器,将待识别的声纹信号按尺度因子为2b的方式进行基于小波变换的向上/向下采样,其中b表示小波变换的变换级数,本发明将其设为2,所述采样表达式为:
其中:
a为尺度因子;
c为位移因子;
f(t)为待识别的声纹信号;
t为声纹信号的时刻;
l表示小波变换的子带个数;
根据上述采样表达式,本发明首先将待识别声纹信号f(t)分解为两个相等长度且各自携带低频和高频信息分量的子带信号,然后再次应用该分解操作将每个子带的信号分解为下一级子带信号,即四个子带信号;
2)设定小波阈值λ:
其中:
y为可变参数,当噪声为白噪声时,y为1;
N为待识别声纹信号的信号长度;
σ为小波子带信号的标准差;
j为小波子带的数量;
3)利用基于阈值的降...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。