噪声环境下语音端点的检测方法技术

技术编号:15897102 阅读:65 留言:0更新日期:2017-07-28 20:42
本发明专利技术提供了一种噪声环境下语音端点的检测方法,包括:步骤1:根据人耳的基底膜的听觉特性将20~22050Hz的频率范围分成25个频率群;步骤2:计算与每个频率群相对应的不等带宽子带的方差Di;步骤3:根据计算出的频率群的不等带宽子带的方差Di,通过单参数双门限法检测语音信号的起止端点。本发明专利技术利用人耳的听觉特性和频带方差对语音能量的起伏的敏感度来进行语音端点的检测,方法简便,检测的准确率更高。

Method for detecting speech endpoint in noisy environment

The invention provides a method for endpoint detection in noisy environments, including: Step 1: according to the characteristics of the basement membrane of the human ear hearing will be 20 ~ 22050Hz frequency range into 25 frequency group; step 2: Di variance calculation and each frequency bandwidth ranging from sub group corresponding belt; step 3: according to the variance of the calculated bandwidth ranging from Di sub frequency band group, the single parameter double threshold method of voice signal detection terminals. The invention utilizes the auditory characteristics of human ears and the frequency band variance to detect the speech endpoint of the sensitivity of the fluctuation of the speech energy, and has the advantages of simple method and high detection accuracy.

【技术实现步骤摘要】
噪声环境下语音端点的检测方法
本专利技术涉及语音信号处理
,更为具体地,涉及一种噪声环境下语音端点的检测方法。
技术介绍
语音端点检测是语音识别中一个重要的缓解,语音端点检测能够对语音信号进行更好的分析和训练,从而提高语音识别的识别率。现有的端点检测算法如利用过零率、短时能量和自相关参数,在高信噪比环境下可以获得较好的检测效果,但在低信噪比环境下其检测性能却急剧下降。当语音信号包含有背景噪音时,从中检测出语音信号的起始点和终止点,可以减少数据的采集量,删除不含语音信号的背景噪声和无声段,从而降低特征提取的计算量和处理时间,提高语音识别的准确性。因此,噪声环境中准确的检测语音的起止点有利于提高语音系统性能。当语音中含有噪音时,现有的语音端点检测方法显得有些无能为力。
技术实现思路
鉴于上述问题,本专利技术的目的是提供一种噪声环境下语音端点的检测方法,以解决现有的语音端点检测方法在低信噪比环境下其检测性能低的问题。本专利技术提供的噪声环境下语音端点的检测方法,包括:步骤1:根据人耳的基底膜的听觉特性将20~22050Hz的频率范围分成25个频率群;步骤2:计算与每个频率群相对应的不等带本文档来自技高网...
噪声环境下语音端点的检测方法

【技术保护点】
一种噪声环境下语音端点的检测方法,包括:步骤1:根据人耳的基底膜的听觉特性将20~22050Hz的频率范围分成25个频率群;步骤2:计算与每个频率群相对应的不等带宽子带的方差Di;步骤3:根据计算出的频率群的不等带宽子带的方差Di,通过单参数双门限法检测语音信号的起止端点。

【技术特征摘要】
1.一种噪声环境下语音端点的检测方法,包括:步骤1:根据人耳的基底膜的听觉特性将20~22050Hz的频率范围分成25个频率群;步骤2:计算与每个频率群相对应的不等带宽子带的方差Di;步骤3:根据计算出的频率群的不等带宽子带的方差Di,通过单参数双门限法检测语音信号的起止端点。2.如权利要求1所述的噪声环境下语音端点的检测方法,其中,每个频率群中的中心频率、临界带宽、下限频率和上限频率分别代表一项参数,且所述中心频率、所述下限频率和所述上限频率被构成一个3×25维的数组。3.如权利要求2所述的噪声环境下语音端点的检测方法,其中,在计算每个频率群的不等带宽子带的方差的过程中,包括:步骤21:根据语音信号x(n)的采样频率fs,求出在(0~fs/2)频率区间内的不等带宽子带的数量q;步骤22:对所述语音信号x(n)进行加窗分帧处理得到第i帧的语音信号xi(m),经快速傅氏变换后得到(N/2+1)条正频率幅值谱线Xi,Xi={Xi(1),Xi(2),...,Xi(N/2+1)},i=0,1,2,...,N为帧长;步骤23:通过内插的方法对(N/2+1)条正频率幅值谱线Xi进行扩展;步骤24:计算每个不等带宽子带内频谱的平均幅值Ei(j):

【专利技术属性】
技术研发人员:林海波程吕鹏
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1