基于熵的端点检测方法技术

技术编号：3047018 阅读：169 留言：0更新日期：2012-04-11 18:40

一种基于熵的端点检测方法，包括步骤：１）计算信号开始时Ｎ１帧的能量Ｅ＿ｎｏｉｓｅ；２）根据步骤１）得到的噪声估计值Ｅ＿ｎｏｉｓｅ，指定相应的Ｋ值；３）使用步骤２）选定的Ｋ值，利用公式（４）、（３）计算每帧的负熵Ｅｎｔｒｏｐｙ；４）以当前帧前面数帧的平均负熵值Ｍｅａｎ＋Ｖ１作为第一个门限Ｔｈ１，以Ｍｅａｎ＋Ｖ２作为第一个门限Ｔｈ２。不断推进当前帧，直到找到满足判决机制的帧作为语音的起始点；５）找到起始点后，将Ｋ取为Ｋ＃－［０］，利用公式（４）、（３）计算其后每帧的负熵；６）找到起始点之后，向前推进直到某帧负熵Ｅｎｔｒｏｐｙ小于Ｔｈ３，从此处向后寻找谷底，且将其作为当前帧。不断推进当前帧，直到找到满足判决机制的帧作为语音的终点；７）重复步骤３到步骤６，直到信号结束。８）对每一起点、终点对，如果其帧数小于最短句子帧数，则认为其间的数据不是语音，而是噪声；如果在两段语音之间的间隙小于最短停顿帧数，则认为两段语音可合为一段语音。（*该技术在2021年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别，特别涉及。Jia-lin Shen[1]提出谱熵的定义。本专利技术来源于对谱熵所具有的性能的深入了解。为了更好地理解本专利技术，首先说明谱熵的原理，分析其性能。1) 谱熵的基本原理参考[1]，首先通过快速傅立叶变换来得到每一帧信号的频谱，其中每个频谱向量的各个系数表明了该帧信号在该频率点的大小分布。然后，计算每一帧的每个频谱能量分量在每帧的总能量中所占的比例，将其作为代表信号能量集中在某频率点的概率大小，即计算谱熵所需的概率密度函数通过下式计算pi=Y(fi)/Σk=0N-1Y(fk),i=0...N-1---(1)]]>此处N表示FFT计算所取的点数，Y(fi)表示第i个频率点的谱能量，pi表示相应的概率。由于语音的大部分能量集中在250Hz到6000Hz之间，所以为了集中计算熵以增加语音和非语音在概率密度函数上的区分性，可以把处于250Hz和6000Hz之外的频率分量置为0，即Y(fi)＝0，当fi＜250Hz或fi＞6000Hz时 (2)接下来，计算谱熵H=-Σk=0N-1pklogpk---(3)]]>2) 谱熵的性能分析公式(3)表明谱熵是信源的平均不定性的体现。对于不同的信源，在频域上有不同的概率分布，导致有不同的谱熵。附图说明图1给出了噪声库NOISEX-92中部分噪声和语音信号的谱熵取负后的曲线，每20帧平滑一次，我们称其为负熵曲线以和(3)式中的谱熵相区别。参照图1，可以看到，不同噪声的负熵的最小值、最大值、均值、方差均不同，而且大部分的噪声和语音...

【技术保护点】
一种基于熵的端点检测方法，包括步骤：１）．计算信号开始时Ｎ１帧的能量Ｅ＿ｎｏｉｓｅ；２）．根据步骤１）得到的噪声估计值Ｅ＿ｎｏｉｓｅ，指定相应的Ｋ值；３）．使用步骤２）选定的Ｋ值，利用公式（４）、（３）计算每帧的负熵Ｅｎｔｒｏｐｙ；４）．以当前帧前面数帧的平均负熵值Ｍｅａｎ＋Ｖ１作为第一个门限Ｔｈ１，以Ｍｅａｎ＋Ｖ２作为第一个门限Ｔｈ２。不断推进当前帧，直到找到满足判决机制的帧作为语音的起始点；５）．找到起始点后，将Ｋ取为Ｋ↓［０］，利用公式（４）、（３）计算其后每帧的负熵；６）．找到起始点之后，向前推进直到某帧负熵Ｅｎｔｒｏｐｙ小于Ｔｈ３，从此处向后寻找谷底，且将其作为当前帧。不断推进当前帧，直到找到满足判决机制的帧作为语音的终点；７）．重复步骤３到步骤６，直到信号结束。８）．对每一起点、终点对，如果其帧数小于最短句子帧数，则认为其间的数据不是语音，而是噪声；如果在两段语音之间的间隙小于最短停顿帧数，则认为两段语音可合为一段语音。

【技术特征摘要】
1.一种基于熵的端点检测方法，包括步骤1).计算信号开始时N1帧的能量E_noise；2).根据步骤1)得到的噪声估计值E_noise，指定相应的K值；3).使用步骤2)选定的K值，利用公式(4)、(3)计算每帧的负熵Entropy；4).以当前帧前面数帧的平均负熵值Mean+V1作为第一个门限Th1，以Mean+V2作为第一个门限Th2。不断推进当前帧，直到找到满足判决机制的帧作为语音的起始点；5).找到起始点后，将K取为K0，利用公式(4)、(3)计算其后每帧的负熵；6).找到起始点之后，向前推进直到某帧负熵Entropy小于Th3，从此处向后寻找谷底，且将其作为当前帧。不断推进当前帧，直到找到满足判决机制的帧作为语音的终点；7).重复步骤3到步骤6，直到信号结束。8).对每一起点、终点对，如果其帧数小于最短句子帧数，则认为其间的数据不是语音，而是噪声；如果在两段语音之间的间隙小于最短停顿帧数，则认为两段语音可合为一段语音。2.按权利要求1所述的方法，其特征在于在概率计算公式的分子、分母中作加K的计算，本方法所用的概率计算公式是pi′=(Y(fi)+K)/Σk=0N-1(Y(fk)+K),i=0...N-1,K>0---(1)]]>则加K后概率密度的变化为Δpi...

【专利技术属性】
技术研发人员：贾川，徐波，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人