基于时频瞬时能量谱的低信噪比语音端点检测方法技术

技术编号：8735473 阅读：246 留言：0更新日期：2013-05-26 11:51

本发明专利技术涉及一种基于时频瞬时能量谱的低信噪比语音端点检测方法。传统方法降噪效果不是很理想。本发明专利技术方法将时频瞬时能量谱特征作为端点检测的依据，首先对含噪语音进行小波包分解，并对分解后的低频分量进行重构。利用经验模态分解对重构后的信号进行处理，并运用相关系数阈值准则进行固有模态函数的筛选和剔除，获取有效IMF分量。重组得到的IMF分量，进行Hilbert变换并计算相应的瞬时能量谱，构成语音端点检测的特征向量。对得到的结果进行分帧处理，将前5帧瞬时能量谱均值作为噪声的瞬时能量谱，并采用语音起-止双阈值门限法进行含噪语音的端点检测。本发明专利技术使含噪语音的时频分辨能力得到显著的改善，提高了语音端点检测的效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音处理领域，涉及一种。
技术介绍
语音在采集传输以及通信过程中不可避免的会引入各种噪声，噪声的存在将会直接影响语音的清晰度和可懂度。对含噪语音信号进行端点检测，获得有效语音片段的起止点，对于后续的语音增强、编码以及识别工作起着非常重要的作用。目前传统的端点检测方法主要有平均能量、平均过零率、倒谱系数、短时频带方差、短时能频值、倒谱距离、自相关相似距离、信息熵以及谱熵等。但是它们都是基于语音信号具有短时线性平稳的假设，但实际上语音信号为非线性非平稳过程。同时现有的方法抗噪能力普遍不强，当信噪比较低时语音端点检测的准确率普遍不理想。NE.Huang博士于1998年提出了一种新的具有自适应的时频分析方法一Hilbert-Huang变换(HHT)，特别适合于非线性、非平稳的含噪语音时频分析，但是其存在模态混叠等缺点，因此本专利技术提出了一种。
技术实现思路
本专利技术考虑到:(I)传统含噪语音端点检测都是基于语音短时线性平稳过程的假设且对于强噪声背景下的语音端点检测效果不理想；(2)针对含噪语音的HHT变换存在模态混叠从而降低语音信号时频分辨力的缺点，提出了。运用小波包分解对频带进行细分，低频部分中语音信号占主导，对分解的低频信号进行重构和EMD分解。同时利用相关系数阈值准则，对含噪语音EMD分解后的IMF分量进行筛选和剔除。重组得到的有效MF分量，并对其进行Hilbert变换，计算瞬时能量谱作为语音端点检测的特征向量。本专利技术主要是基于Hilbert — Huang变换的语音信号处理，将小波包分解作为含噪语音信号的预处理，改善了含噪语音信号的时频...

【技术保护点】
基于时频瞬时能量谱的低信噪比语音端点检测方法，其特征在于该方法包括如下步骤：步骤（1）对加汉明窗的含噪语音进行小波包分解，并对分解后的信号进行重构；步骤（2）对重构的低频信号进行自适应EMD分解处理，得到有限个IMF分量；步骤（3）采用相关系数阈值准则，对IMF分量进行筛选，得到有效的IMF分量，并进行重组；步骤（4）对重组的IMF分量进行Hilbert变换，同时计算瞬时能量谱序列，将瞬时能量谱特征量作为含噪语音端点检测的依据；步骤（5）对瞬时能量谱序列进行分帧处理，将前5帧瞬时能量谱均值作为噪声的瞬时能量谱；步骤（6）对分帧的瞬时能量谱序列运用起?止双门限阈值法进行语音端点检测，记录有效语音片段的起止点。

【技术特征摘要】

【专利技术属性】
技术研发人员：范影乐，陈金龙，倪红霞，廖进文，李丹菁，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人