基于波形相关法的语音信号基音周期检测方法技术

技术编号:3047051 阅读:234 留言:0更新日期:2012-04-11 18:40
基于波形相关法的语音信号基音周期检测方法,是由语音采集系统将所需检测的语音信号输入计算机,在计算机处理器中完成对语音信号基音周期的检测,主要方法是在时域内,根据数字语音信号的准周期特性,通过比较原始信号和它的移位后的信号之间的相关性来确定基音周期,本发明专利技术的特征在于:利用过去的语音信号样值,来减少传统波形相关估计的延时,同时在语音信号相关估计的前后加入了预处理和后处理技术,进行基音周期检测; 该基音检测方法主要包括四个步骤,第一步为预处理,第二步为语音信号相关系数估计,第三步为后处理,第四步为清音/浊音判决,其步骤为: 第一步进行语音的预处理,包括去均值、低通滤波和数值滤波三部分,各部分分述如下: (1)去均值方法为:对于初始输入的数字语音信号s(n),通常其均值μ不为零或附带有低频噪声,在计算相关函数时,首先要减掉均值μ,去均值的信号s′(n)为 s′(n)=s(n)-μ 其中 μ=1/N*s(n) 式中N为数字语音信号分析帧长; (2)低通滤波方法为:对去均值的语音信号进行800Hz低通滤波,去除了第三和第四个高频共振峰及高频噪声的影响,低通滤波器是依据双线性变换法设计的一个五阶椭圆低通滤波器,其传递函数为: H↓[lpf](z)=*A↓[i]z↑[-i]/*B↓[j]z↑[-j] 式中的滤波器系数A↓[i]和B↓[j]分别为: {A↓[i]}={0.008233,-0.004879,0.007632,0.007632,-0.004879,0.008233} {B↓[i]}={1.0000,-3.6868,5.8926,-5.0085,2.2518,-0.4271} (3)数值滤波方法为: 在低通滤波器之后级联一个数值滤波器去除了声道第一和第二个共振峰的影响;该数值滤波器的传递函数为: H↓[nf](z)=*θ↓[i]z↑[-i] 式中p为数值滤波器阶数,θ↓[i]=1/p为数值滤波器系数; 第二步进行语音信号相关系估计,并以其作为基音检测的依据,具体步骤如下: 令*(n)为预处理后的数字语音信号,则*(n)和其移位后的信号*(n-τ)之间的平方误差为 E(τ)=*[*(n)-β*(n-τ)]↑[2] 式中β为增益因子,τ为介于20和120个样点之间的整数延时,当n-τ<0时,将用到过去的语音信号样值,使E(τ)最小的τ值即为当前帧语音信号的基音周期初估值;令эE(τ)/β=0,可以得到这个最小的E(τ)为: *** 使E(τ)最小等价于使相关系数 *** 最大,使ρ(…。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

,属于语音信号处理,可应用于低速率语音编码、语音合成和语音识别系统中。目前人们主要利用语音信号的时域波形相关和频域谱相关特性进行进行基音检测。本专利技术基于时域波形相关法。在时域中,周期信号的最明显特征就是波形的相关性。基于时域波形相关法的基音检测方法的主要原理是通过比较原始信号和它的移位后的信号之间的类似性来确定基音周期。如果移位距离等于基音周期,那么,两个信号具有最大类似性(或者说是互相关最大)。时域波形相关法的关键性问题是如何定义类似性量度。目前人们大多采用平方代价函数最小原理,这是因为平方代价函数在数学上易于实现。高性能的基音检测方法对保障低速率语音编码器的质量,起到了关键性作用。传统基音检测方法还存在这样或那样的一些缺陷,如应用范围受限、正确估计率低、延时大和算法复杂等。本专利技术的技术方案主要流程如图5所示。是由语音采集系统将所需检测的语音信号输入计算机,在计算机处理器中完成对语音信号基音周期的检测,主要方法是在时域内,根据数字语音信号的准周期特性,通过比较原始信号和它的移位后的信号之间的相关性来确定基音周期,本专利技术的特征在于利用过去的语音信号样值,即数字语音信本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于波形相关法的语音信号基音周期检测方法,是由语音采集系统将所需检测的语音信号输入计算机,在计算机处理器中完成对语音信号基音周期的检测,主要方法是在时域内,根据数字语音信号的准周期特性,通过比较原始信号和它的移位后的信号之间的相关性来确定基音周期,本发明的特征在于利用过去的语音信号样值,来减少传统波形相关估计的延时,同时在语音信号相关估计的前后加入了预处理和后处理技术,进行基音周期检测;该基音检测方法主要包括四个步骤,第一步为预处理,第二步为语音信号相关系数估计,第三步为后处理,第四步为清音/浊音判决,其步骤为第一步进行语音的预处理,包括去均值、低通滤波和数值滤波三部分,各部分分述如下(1)去均值方法为对于初始输入的数字语音信号s(n),通常其均值μ不为零或附带有低频噪声,在计算相关函数时,首先要减掉均值μ,去均值的信号s′(n)为s′(n)=s(n)-μ其中μ=1NΣn-0N-1s(n)]]>式中N为数字语音信号分析帧长;(2)低通滤波方法为对去均值的语音信号进行800Hz低通滤波,去除了第三和第四个高频共振峰及高频噪声的影响,低通滤波器是依据双线性变换法设计的一个五阶椭圆低通滤波器,其传递函数为Hlpf(z)=Σi=05Aiz-iΣj=05Bjz-j]]>式中的滤波器系数Ai和Bj分别为{Ai}={0.008233,-0.004879,0.007632,0.007632,-0.004879,0.008233}{Bi}={1.0000,-3.6868,5.8926,-5.0085,2.2518,-0.4271}(3)数值滤波方法为在低通滤波器之后级联一个数值滤波器去除了声道第一和第二个共振峰的影响;该数值滤波器的传递函数为Hnf(z)=Σi=0p-1θiz-i]]>式中p为数值滤波器阶数,θi=1p]]>为数值滤波器系数;第二步进行语音信号相关系估计,并以其作为基音检测的依据,具体步骤如下令 为预处理后的数字语音信号,则 和其移位后的信号 之间的平方误差为E(τ)=Σn=0N-1[s^(n)-βs^(n-τ)]2]]>式中β为增益因子,τ为介于20和120个样点之间的整数延时,当n-τ<0时,将用到过去的语音信号样值,使E(τ)最小的τ值即为当前帧语音信号的基音周期初估值;令∂E(τ)/β=0,]]>可以得到这个最小的E(τ)为E(τ)=Σn=0N-1s^2(n)-[Σ...

【专利技术属性】
技术研发人员:鲍长春
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利