计算语音基音频率的方法及设备技术

技术编号:4183743 阅读:496 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及信号处理领域,公开了一种计算语音基音频率的方法及设备,能够更为准确地估计基音频率。本发明专利技术中,在计算基音频率之前先对所用的频域信号进行重构,生成一个定义域连续的重构函数,该函数在各频域峰值附近的定义域中按相应的频域信号进行曲线拟合,在其它的定义域中对相应的频域信号进行有效抑制。在基音搜索时综合考虑候选基音频率及其多个倍频。

【技术实现步骤摘要】

本专利技术涉及语音信号处理领域,特别涉及计算语音基音频率的技术。
技术介绍
随着网络和多媒体技术的快速发展,语音处理系统已经普及到广播、电视、 通讯等各领域中,从广播、电视节目的制作设备到手持电话、便携式音频/视频 播放设备都离不开语音处理系统。在语音信号处理和语音编解码领域,正确地估计基音频率是极其重要的。从语音产生原理的角度来说,语音来源于声腔的振动,产生声波,再经过 声道器官的调制得到语音信号。声腔的振动通常会决定产生的语音信号的类型, 例如元音,辅音,摩擦音等等。在实际出现的语音中,元音是占有着很大比例 的。 一个英语单词通常包含着较大部分的元音。从信号分析的角度上来看,元 音主要由谐波组成,即它的频率分量由一个基音频率(也可简称为基频)和若 千个它的整数倍频率组成。在专利号为4, 161, 625的美国专利中,公开了一种从语音信号中获得基 音频率的方法。在该专利中,通过对初始的语音信号进行处理,得到差异信号, 再采用自相关算法根据差异信号得到基音频率。由于在实际语音编解码和语音信号处理的算法里(例如语音编解码标准 G.729等),传统的计算基音频率算法主要是自相关算法,即通过计算语音 信号的最大自相关系数来找到特定的值。因为语音信号中通常包含大量的噪 声,所以使用以自相关算法为基础的基音频率的计算方法可能存在一定偏差。
技术实现思路
本专利技术的目的在于提供一种计算语音基音频率的方法及设备,能够更为 准确地估计基音频率。本专利技术公开了一种计算语音基音频率的方法,包括以下步骤 将时域的语音信号变换为离散的频域信号X,,其中i=1,2,...,N;在l义,l中找出各作为局部最大值的峰值Mj,其中j-1,2,…,L, L为峰值的 数目,| l表示取绝对值;在所述离散的频域信号所涉及的定义域内,构造L个不重叠的区域Zj, 每个&的大小是预定的,每个A覆盖一个A,其中£>,是肘7在定义域所对应 的值;以每个Z;为定义域分别构造连续函数& , w e Z"满足I&(A)< Cl ,其中^是x,在定义域所对应的值,C1是一个正的常数;在各Z;没有覆盖的定义域中,构造函数S。 (") , w e 且《 g Zy ,其中F,为采样率,满足s。(化)叫xj;将由各s;⑨和s。 (《)组合成的作为频谱计算基音频率。本专利技术还公开了一种计算语音基音频率的设备,包括变换单元,用于将时域的语音信号变换为离散的频域信号义,,其中 i=1,2,…,N;峰值计算单元,用于在I《I中找出各作为局部最大值的峰值M"其中 j=1,2,...,L, L为峰值的数目,||表示取绝对值;重构单元,用于在所述离散的频域信号所涉及的定义域内,构造L个不重叠的区域Z"每个Z,的大小是预定的,每个〈覆盖一个ZV其中A是M,在 定义域所对应的值;以每个A为定义域分别构造连续函数^(o;), 满 足l^(^)-lz,l卜ci,其中^是X,在定义域所对应的值,C1是一个正的常数;在各Z,没有覆盖的定义域中,构造函数S。(必),《e且wgZ"其中F,为采样率,满足5。(必,)<|《|。下面对连续函数57( )的构造方式做进一步说明。在本实施方式中,通过用峰值对应的频域信号绝对值以及其前后两个频 域信号绝对值进行二项式插值,实现连续函数&(w)的构造。比如说,第一个 峰值M,对应的频域信号绝对值"在定义域所对应的值为,则其前后两个频 域信号绝对值(乙,K+1 )在定义域所对应的值为()。假设这个插 值多项式由如下的二次三项式表示/(x) = ax2 + + c则通过代入法可以解得对应的系数Ua,c):9<formula>formula see original document page 10</formula>因此,可以得到S,(w)-fl一2+同理,可通过二项式插值方式构造出各&(w)函数,即S/w)需要说明的是,由于在本实施方式中,峰值Mj实际上是在三点之中选取 的最大值,因此如果第一个峰值M,对应的频域信号绝对值为",则区域Z,的 起始位置为L在定义域所对应的值,结束位置为在定义域所对应的值,即21 =尺,同理,可得到各Z,的区域。每一个峰值对应的拟合曲线的定义域也可以采取其它任意合理的长度对于各Z/没有覆盖的定义域而言,由于这些区域不含有基音信息,因此可以简单地将这些部分用任意函数S。(w)代替,we且c^A,函数S。(w) 需满足S。(^)叫X,I这一条件即可。比如说,采用零函数,即S。(w)-0。由于在本步骤中,已分别对这两种类型的频语进行了函数重构,因此整 个频i昝都被重构成为一个定义域连续的函数,即<formula>formula see original document page 10</formula>接着,进入步骤140,计算基音频率。具体地说,由于在步骤130中, 已得出 一 个定义域连续的函数,根据此函数的函数特点即可直接导 出基音频率。比如说,在基音的可能存在范围(如从50赫兹到500赫兹) 进行搜索,搜索的准则是找到满足如下式子的频率雖) =argmax 2 | S(一 |2其中,iV(w)是以w为基音频率的谐波个数, 即为基音频率。需要说明 的是,上述公式只是一个作为搜索准则的具体例子,在实际应用中,也可以 采用其他的公式,如将上述公式中的平方更改为4次方或1次方等。上述^相关公式的实质在于在基音搜索时综合考虑候选基音频率及其多个倍频,具 体的公式形式可以有其它的变化,这样可以使搜索结果更为准确由于在本实施方式中,在计算基音频率之前先对所用的频域信号进行重 构,生成一个定义域连续的重构函数,该函数在各频域峰值附近的定义域中 按相应的频域信号进行曲线拟合,在其它的定义域中对相应的频域信号进行 有效抑制。因为候选基音频率及其倍数频率通常表现为峰值,所以通过保留 各峰值附近定义域中的频域信号、大幅削弱其它定义域中的频域信号,可以 提高基音频率计算的准确性和抗干扰能力。通过变换得到的频域信号是离散 的,通过对定义域的连续化可以更为精确地进在重构函数所代表的频谱中搜 索基音频率。值得一提的是,在本实施方式中,对各^没有覆盖的定义域所构造的函 数S。(的为S。(《) = 0,从而最大限度削弱无关的频率分量,进一步提高基音 频率计算的准确性和抗千扰能力。而在实际应用中,也可以将函数S。(w)置为 一个很小的值,同样可以较为准确地搜索到基音频率。本专利技术的第二实施方式涉及一种计算语音基音频率的方法,本实施方式 与第一实施方式大致相同,其区别在于,在第一实施方式中,在构造连续函 数^如)时,是通过用峰值对应的频域信号绝对值以及其前后两个频域信号绝对值进行二项式插值实现的;而在本实施方式中,可以通过拟合成分段直线, 或用三次多项式来拟合,来实现连续函数57 的构造。ii本专利技术的方法实施方式可以以软件、;哽件、固件等等方式实现。不管本 专利技术是以软件、硬件、还是固件方式实现,指令代码都可以存储在任何类型 的计算机可访问的存储器中(例如永久的或者可修改的,易失性的或者非易失性的,固态的或者非固态的,固定的或者可是换的介质等等)。同样,本文档来自技高网...

【技术保护点】
一种计算语音基音频率的方法,其特征在于,包括以下步骤: 将时域的语音信号变换为离散的频域信号X↓[i],其中i=1,2,…,N; 在|X↓[i]|中找出各作为局部最大值的峰值M↓[j],其中j=1,2,…,L,L为峰值的数目,| |表示取绝对值; 在所述离散的频域信号所涉及的定义域内,构造L个不重叠的区域Z↓[j],每个Z↓[j]的大小是预定的,每个Z↓[j]覆盖一个D↓[j],其中D↓[j]是M↓[j]在定义域所对应的值; 以每个Z↓[j]为定义域分别 构造连续函数S↓[j](ω),ω∈Z↓[j],满足|S↓[j](ω↓[i])-|X↓[i]||<C1,其中ω↓[i]是X↓[i]在定义域所对应的值,C1是一个正的常数; 在各Z↓[j]没有覆盖的定义域中,构造函数S↓[0](ω),ω∈ [0 Fs/2],且ω*Z↓[j],其中F↓[s]为采样率,满足S↓[0](ω↓[i])<|X↓[i]|; 将由各S↓[j](ω)和S↓[0](ω)组合成的S(ω)作为频谱计算基音频率。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄鹤云林福辉
申请(专利权)人:展讯通信上海有限公司
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1