当前位置: 首页 > 专利查询>汪金玲专利>正文

一种基于WT的声纹识别方法及系统技术方案

技术编号:26422444 阅读:40 留言:0更新日期:2020-11-20 14:18
本发明专利技术涉及一种声纹识别的技术领域,揭露了一种基于WT的声纹识别方法,包括:采用麦克风阵列对待识别声纹信号进行采集,并利用基于相位变换的声源分离算法对待识别声纹信号进行滤波处理;利用基于小波阈值的去噪算法对经滤波处理的声纹信号进行降噪处理,得到降噪后的声纹信号;对降噪后的待识别声纹信号进行预加重和加窗的预处理;利用基于毛细胞函数的声纹特征提取算法提取经预处理的声纹信号的声纹特征,得到待识别声纹信号的声纹特征;利用能量算子提取声纹特征中的能量参数,并利用对数似然比算法进行声纹的识别。本发明专利技术还提供了一种基于WT的声纹识别系统。本发明专利技术实现了声纹的识别。

【技术实现步骤摘要】
一种基于WT的声纹识别方法及系统
本专利技术涉及声纹识别的
,尤其涉及一种基于WT的声纹识别方法及系统。
技术介绍
语音作为人与人之间实现信息交互的最直接的、最常用的和最便捷的载体,承载和传达着各种信息资源,在人机交互和信息传递中发挥着重大作用。但由于现实生活中有太多噪声的干扰,利用声纹识别出来的语音质量比较差,不容易被人们理解,也会使得人机设备难以获得准确的信息,如何有效完成声纹识别任务成为当前研究的热门话题。在现有声纹识别技术中,只注重于去噪后语音的信噪比,而没有注意去噪语音的整体质量。这些声纹识别技术有可能把语音信号较弱部分当作噪声去除了,使得在去除背景噪声同时,有用语音信号的成分也受到了损伤。这样一来,去噪处理后的语音信号与去噪前的信号相比较,听觉质量可能没有本质上的提升,甚至出现倒退。同时在语音特征参数领域中,被广泛使用的特征有:MFCC、感知线性预测系数和感知对数面积比系数。这些特征在纯净环境下可以取得良好的识别准确率,但并不能有效地适应噪声环境,尤其是10dB以下的噪音条件下,它们的性能会随着信噪比的降低而降低。鉴于此,如何有效地对声纹进行去噪,并提取能适应噪声环境的声纹特征以进行声纹识别,成为本领域技术人员亟待解决的问题。
技术实现思路
本专利技术提供一种基于WT(wavelettransform,小波变换)的声纹识别方法,通过利用基于小波变换的去噪算法对声纹进行降噪处理,并对现有声纹特征提取算法进行改进,利用改进的声纹特征提取算法进行声纹特征的提取和增强,最终实现对声纹的识别。为实现上述目的,本专利技术提供的一种基于WT的声纹识别方法,包括:采用麦克风阵列对待识别声纹信号进行采集;利用基于相位变换的声源分离算法对待识别声纹信号进行滤波处理;利用基于小波阈值的去噪算法对经滤波处理的声纹信号进行降噪处理,得到降噪后的声纹信号;对降噪后的待识别声纹信号进行预加重和加窗的预处理;利用基于毛细胞函数的声纹特征提取算法提取经预处理的声纹信号的声纹特征,得到待识别声纹信号的声纹特征;利用能量算子提取声纹特征中的能量参数,并利用对数似然比算法进行声纹的识别。可选地,所述采用麦克风阵列对声纹信号进行采集,包括:采用麦克风阵列对待识别声纹信号进行采集,其中所采集到的第i个通道信号为xi(t),它是由J个未知信号源sj(t)卷积混合而成的带噪语音信号,所述卷积混合公式为:其中:a(t)为冲激响应;sj(t)表示第j个未知信号源;J为未知信号源的个数;bi(t)为噪音信号;xi(t)为所采集到的第i个通道信号;t表示离散时间。可选地,所述利用基于相位变换的声源分离算法对待识别声纹信号进行滤波处理,包括:1)计算任意两个待识别声纹信号的互相关关系:其中:x1(t),x2(t)为所采集的任意两个待识别声纹信号;α表示声音从声源传播到麦克风的衰减;s表示未知信号源发出的信号;τ表示声音从声源传播到两个麦克风的时间;2)由互相关关系与互频率谱的关系可知:其中:为麦克风接收信号x1(t)和x2(t)的互功率谱;ω表示功率相位;3)在频域对功率谱进行加权处理,实现对待识别声纹信号的滤波处理,所述加权公式为:其中:表示相位加权函数;X1(ω),X2(ω)表示由傅里叶变换得到的两麦克风接收信号的功率谱;为麦克风接收信号x1(t)和x2(t)的互功率谱;ω表示功率相位。可选地,所述利用基于小波阈值的去噪算法对经滤波处理的声纹信号进行降噪处理,包括:1)利用低通/高通滤波器,将待识别的声纹信号按尺度因子为2b的方式进行基于小波变换的向上/向下采样,其中b表示小波变换的变换级数,本专利技术将其设为2,所述采样表达式为:其中:a为尺度因子;c为位移因子;f(t)为待识别的声纹信号;t为声纹信号的时刻;l表示小波变换的子带个数;根据上述采样表达式,本专利技术首先将待识别声纹信号f(t)分解为两个相等长度且各自携带低频和高频信息分量的子带信号,然后再次应用该分解操作将每个子带的信号分解为下一级子带信号,即四个子带信号;2)设定小波阈值λ:其中:y为可变参数,当噪声为白噪声时,y为1;N为待识别声纹信号的信号长度;σ为小波子带信号的标准差;j为小波子带的数量;3)利用基于阈值的降噪函数对达到小波阈值的小波子带进行降噪处理,所述基于阈值的降噪函数为:其中:λ为小波阈值;p为小于小波阈值的正实数;a为小波参数,本专利技术将其设为0.01;b表示小波变换的变换级数,本专利技术将其设为2;l表示小波变换的子带个数;为基于小波变换的采样信号;wl为第l个小波子带的降噪信号。可选地,所述对降噪后的声纹信号进行预加重和加窗的预处理,包括:1)利用预加重的函数式提高声纹信号:H(z)=1-az-1其中:z为待识别的声纹信号;a为预加重系数,本专利技术将其设为0.912;2)利用汉明窗对所述声纹信号进行加窗处理,所述汉明窗的时域表达式为:其中:n为待识别声纹信号的帧数;N为待识别声纹信号的总帧数。可选地,所述利用基于毛细胞函数的声纹特征提取算法提取经预处理的声纹信号的声纹特征,包括:1)利用毛细胞函数对经预处理的声纹信号进行处理:h(a,b)=[H(a,b)]2其中:H(a,b)为经预处理的声纹信号;2)利用滤波器对毛细胞函数进行响应,得到每个毛细胞的输出:其中:d表示第i频带毛细胞函数的窗长;τi为第i个滤波器中心频率的时间长度;L为帧移;3)将毛细胞函数的输出进行基于响度函数的立方根尺度变换,由能量值变为感知响度,其计算公式为:y(i,j)=[S(i,j)]1/34)采用离散余弦变换进行去相关处理,得到声纹特征为:其中:M表示滤波器的个数;i表示第i频带;n表示声纹信号在n点的采样。所述利用能量算子提取声纹特征中的能量参数,包括:利用能量算子提取声纹特征中的能量参数,所述能量参数的提取公式为:ψ[f(i,n)]=[f(i,n)]2-f(i,n+1)f(i,n-1)其中:i表示声纹信号的第i频带;n表示声纹信号在n点的采样;对所述能量参数进行归一化处理并取对数:其中:ψ[f(i,n)]表示第i频带的声纹信号,在n点的能量参数。此外,为实现上述本文档来自技高网...

【技术保护点】
1.一种基于WT的声纹识别方法,其特征在于,所述方法包括:/n采用麦克风阵列对待识别声纹信号进行采集;/n利用基于相位变换的声源分离算法对待识别声纹信号进行滤波处理;/n利用基于小波阈值的去噪算法对经滤波处理的声纹信号进行降噪处理,得到降噪后的声纹信号;/n对降噪后的待识别声纹信号进行预加重和加窗的预处理;/n利用基于毛细胞函数的声纹特征提取算法提取经预处理的声纹信号的声纹特征,得到待识别声纹信号的声纹特征;/n利用能量算子提取声纹特征中的能量参数,并利用对数似然比算法进行声纹的识别。/n

【技术特征摘要】
1.一种基于WT的声纹识别方法,其特征在于,所述方法包括:
采用麦克风阵列对待识别声纹信号进行采集;
利用基于相位变换的声源分离算法对待识别声纹信号进行滤波处理;
利用基于小波阈值的去噪算法对经滤波处理的声纹信号进行降噪处理,得到降噪后的声纹信号;
对降噪后的待识别声纹信号进行预加重和加窗的预处理;
利用基于毛细胞函数的声纹特征提取算法提取经预处理的声纹信号的声纹特征,得到待识别声纹信号的声纹特征;
利用能量算子提取声纹特征中的能量参数,并利用对数似然比算法进行声纹的识别。


2.如权利要求1所述的一种基于WT的声纹识别方法,其特征在于,所述采用麦克风阵列对声纹信号进行采集,包括:
采用麦克风阵列对待识别声纹信号进行采集,其中所采集到的第i个通道信号为xi(t),它是由J个未知信号源sj(t)卷积混合而成的带噪语音信号,所述卷积混合公式为:



其中:
a(t)为冲激响应;
sj(t)表示第j个未知信号源;
J为未知信号源的个数;
bi(t)为噪音信号;
xi(t)为所采集到的第i个通道信号;
t表示离散时间。


3.如权利要求2所述的一种基于WT的声纹识别方法,其特征在于,所述利用基于相位变换的声源分离算法对待识别声纹信号进行滤波处理,包括:
1)计算任意两个待识别声纹信号的互相关关系:



其中:
x1(t),x2(t)为所采集的任意两个待识别声纹信号;
α表示声音从声源传播到麦克风的衰减;
s表示未知信号源发出的信号;
τ表示声音从声源传播到两个麦克风的时间;
2)由互相关关系与互频率谱的关系可知:



其中:

为麦克风接收信号x1(t)和x2(t)的互功率谱;
ω表示功率相位;
3)在频域对功率谱进行加权处理,实现对待识别声纹信号的滤波处理,所述加权公式为:






其中:

表示相位加权函数;
X1(ω),X2(ω)表示由傅里叶变换得到的两麦克风接收信号的功率谱;

为麦克风接收信号x1(t)和x2(t)的互功率谱;
ω表示功率相位。


4.如权利要求3所述的一种基于WT的声纹识别方法,其特征在于,所述利用基于小波阈值的去噪算法对经滤波处理的声纹信号进行降噪处理,包括:
1)利用低通/高通滤波器,将待识别的声纹信号按尺度因子为2b的方式进行基于小波变换的向上/向下采样,其中b表示小波变换的变换级数,本发明将其设为2,所述采样表达式为:



其中:
a为尺度因子;
c为位移因子;
f(t)为待识别的声纹信号;
t为声纹信号的时刻;
l表示小波变换的子带个数;
根据上述采样表达式,本发明首先将待识别声纹信号f(t)分解为两个相等长度且各自携带低频和高频信息分量的子带信号,然后再次应用该分解操作将每个子带的信号分解为下一级子带信号,即四个子带信号;
2)设定小波阈值λ:



其中:
y为可变参数,当噪声为白噪声时,y为1;
N为待识别声纹信号的信号长度;
σ为小波子带信号的标准差;
j为小波子带的数量;
3)利用基于阈值的降...

【专利技术属性】
技术研发人员:汪金玲
申请(专利权)人:汪金玲
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1