计算语音基音频率的方法及设备技术

技术编号：4183743 阅读：496 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及信号处理领域，公开了一种计算语音基音频率的方法及设备，能够更为准确地估计基音频率。本发明专利技术中，在计算基音频率之前先对所用的频域信号进行重构，生成一个定义域连续的重构函数，该函数在各频域峰值附近的定义域中按相应的频域信号进行曲线拟合，在其它的定义域中对相应的频域信号进行有效抑制。在基音搜索时综合考虑候选基音频率及其多个倍频。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音信号处理领域，特别涉及计算语音基音频率的技术。
技术介绍
随着网络和多媒体技术的快速发展，语音处理系统已经普及到广播、电视、通讯等各领域中，从广播、电视节目的制作设备到手持电话、便携式音频/视频播放设备都离不开语音处理系统。在语音信号处理和语音编解码领域，正确地估计基音频率是极其重要的。从语音产生原理的角度来说，语音来源于声腔的振动，产生声波，再经过声道器官的调制得到语音信号。声腔的振动通常会决定产生的语音信号的类型，例如元音，辅音，摩擦音等等。在实际出现的语音中，元音是占有着很大比例的。一个英语单词通常包含着较大部分的元音。从信号分析的角度上来看，元音主要由谐波组成，即它的频率分量由一个基音频率(也可简称为基频)和若千个它的整数倍频率组成。在专利号为4， 161, 625的美国专利中，公开了一种从语音信号中获得基音频率的方法。在该专利中，通过对初始的语音信号进行处理，得到差异信号，再采用自相关算法根据差异信号得到基音频率。由于在实际语音编解码和语音信号处理的算法里(例如语音编解码标准 G.729等)，传统的计算基音频率算法主要是自相关算法，即通过计算语音信号的最大自相关系数来找到特定的值。因为语音信号中通常包含大量的噪声，所以使用以自相关算法为基础的基音频率的计算方法可能存在一定偏差。
技术实现思路
本专利技术的目的在于提供一种计算语音基音频率的方法及设备，能够更为准确地估计基音频率。本专利技术公开了一种计算语音基音频率的方法，包括以下步骤将时域的语音信号变换为离散的频域信号X,，其中i=1,2,...，N;...

【技术保护点】
一种计算语音基音频率的方法，其特征在于，包括以下步骤：　将时域的语音信号变换为离散的频域信号Ｘ↓［ｉ］，其中ｉ＝１，２，…，Ｎ；　在｜Ｘ↓［ｉ］｜中找出各作为局部最大值的峰值Ｍ↓［ｊ］，其中ｊ＝１，２，…，Ｌ，Ｌ为峰值的数目，｜｜表示取绝对值；　在所述离散的频域信号所涉及的定义域内，构造Ｌ个不重叠的区域Ｚ↓［ｊ］，每个Ｚ↓［ｊ］的大小是预定的，每个Ｚ↓［ｊ］覆盖一个Ｄ↓［ｊ］，其中Ｄ↓［ｊ］是Ｍ↓［ｊ］在定义域所对应的值；　以每个Ｚ↓［ｊ］为定义域分别构造连续函数Ｓ↓［ｊ］（ω），ω∈Ｚ↓［ｊ］，满足｜Ｓ↓［ｊ］（ω↓［ｉ］）－｜Ｘ↓［ｉ］｜｜＜Ｃ１，其中ω↓［ｉ］是Ｘ↓［ｉ］在定义域所对应的值，Ｃ１是一个正的常数；　在各Ｚ↓［ｊ］没有覆盖的定义域中，构造函数Ｓ↓［０］（ω），ω∈ ［０　Ｆｓ／２］，且ω＊Ｚ↓［ｊ］，其中Ｆ↓［ｓ］为采样率，满足Ｓ↓［０］（ω↓［ｉ］）＜｜Ｘ↓［ｉ］｜；　将由各Ｓ↓［ｊ］（ω）和Ｓ↓［０］（ω）组合成的Ｓ（ω）作为频谱计算基音频率。

【技术特征摘要】

【专利技术属性】
技术研发人员：黄鹤云，林福辉，
申请(专利权)人：展讯通信上海有限公司，
类型：发明
国别省市：31[中国|上海]

全部详细技术资料下载我是这个专利的主人