基于相关函数最大值的广播语音与噪声检测的方法技术

技术编号:21161641 阅读:24 留言:0更新日期:2019-05-22 08:28
本发明专利技术涉及一种基于相关函数最大值的广播语音与噪声检测的方法,通过对语音信号进行分帧;根据自(互)相关函数公式进行每帧语音信号相关函数计算;求取分帧每帧语音信号的自(互)相关函数或互相关函数的最大值;计算一秒内自(互)相关函数的最大值方差,设置一个阈值常数Th,当最大值方差大于Th时,便判断为语音,最大值方差小于Th时,便判定为噪声。此方法将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。

Detection of Broadcast Speech and Noise Based on Maximum Relevance Function

The present invention relates to a method for detecting broadcasting speech and noise based on maximum correlation function, by subdividing the speech signal into frames, calculating the correlation function of each frame of speech signal according to the formula of self-correlation function, calculating the maximum auto-correlation function or cross-correlation function of each frame of speech signal in subframe, calculating the maximum variance of the auto-correlation function in one second, and setting up Setting a threshold constant Th, when the maximum variance is greater than Th, it can be judged as speech, and when the maximum variance is less than Th, it can be judged as noise. This method can distinguish the noise in speech and improve the clarity of voice in broadcasting or other sound processing.

【技术实现步骤摘要】
基于相关函数最大值的广播语音与噪声检测的方法
本专利技术涉及一种语音识别技术,特别涉及一种基于相关函数最大值的广播语音与噪声检测的方法。
技术介绍
调频广播中经常听到“呲呲”的声音,是一种叫做似高斯噪声中高幅值部分的失真引起的。这种典型的现象就是听众没有将收音机准确的调到某个台。现实生活中,一些人的声音和这些噪声极为相似,因此,使用傅里叶变换就很难将这些噪声和语音区分开来。
技术实现思路
本专利技术是针对调频广播中嘈杂声难识别区分的问题,提出了一种基于相关函数最大值的广播语音与噪声检测的方法,正确将噪声识别区分出。本专利技术的技术方案为:一种基于相关函数最大值的广播语音与噪声检测的方法,具体包括如下步骤:1)对输入的语音信号进行分帧:设定帧长大小,帧长范围为10~30ms,根据设定对输入的语音信号进行分帧;2)根据自相关函数公式进行每帧语音信号自相关函数计算,根据互相关函数公式进行每帧语音信号与上一帧语音信号互相关函数计算;3)求取分帧每帧语音信号的自相关函数或互相关函数的最大值;4)计算一秒内自相关函数或互相关函数的最大值方差,任取自相关函数的最大值的方差或互相关函数的最大值方差,设置一个阈值常数Th,当最大值方差大于Th时,便判断为语音,最大值方差小于Th时,便判定为噪声;5)进行下一秒内自相关函数或互相关函数的最大值方差,同步骤4)进行同样判断方法判定噪声,直到步骤1)分帧后的输入语音信号全部判定完毕。所述步骤2)中自相关函数公式为:所述互相关函数公式为:其中xi(m)为第i帧的语音信号中的第m个数据;xi-1(m)为第i-1帧的语音信号中的第m个数据;k为延迟量,k=0,1,2,…,L-1;L为语音分帧后每帧的长度。本专利技术的有益效果在于:本专利技术基于相关函数最大值的广播语音与噪声检测的方法,将语音中噪声识别区分出,便于提升广播或其他声音处理中的声音的清晰度。解决高斯噪声中高幅值部分的失真引起的噪声难以区别的问题。附图说明图1为本专利技术基于相关函数最大值的广播语音与噪声检测流程图。具体实施方式如图1所示基于相关函数的最大值的广播语音和噪声检测流程图,具体包括如下步骤:1、对输入的语音信号进行分帧:由于语音信号是一个非稳态、时变的信号,但是可以在“短时间”范围内认为语音信号是稳态的,时不变的。这个短时间一般指10~30ms,本专利技术采用的帧长为20ms;2、求每帧语音信号的短时自相关函数:下标i表示为第i帧,每帧数据的短时自(互)相关函数,自相关函数定义为公式(1),互相关函数的公式为公式(2);其中xi(m)为第i帧的语音信号中的第m个数据;xi-1(m)为第i-1帧的语音信号中的第m个数据;k为延迟量(k=0,1,2,…,L-1);L为语音分帧后每帧的长度。3、求取分帧每帧语音信号的自(互)相关函数的最大值。由于语音信号和噪声信号的自(互)相关函数的最大值大小相差比较多,可以利用这一特点来判断是有话帧还是噪声帧。由于1秒内噪声的自(互)相关函数的最大值波动程度比语音信号小,由此可判定每秒的音频是噪声还是语音,每帧长20ms,因此1s内有50帧;4、计算一秒内50帧自(互)相关函数的最大值方差,方差可以反映信号的波动程度,因此根据噪声的情况,任取自相关函数的最大值的方差或互相关函数的最大值的方差,设置一个阈值常数Th。当方差大于Th时,便判断为语音,小于Th时,便判定为噪声。5、进行下一秒内自(互)相关函数的最大值方差,同步骤4进行同样判断方法判定噪声,直到步骤1分帧后的输入的语音信号全部判定完毕,输出无噪声语音。本文档来自技高网...

【技术保护点】
1.一种基于相关函数最大值的广播语音与噪声检测的方法,其特征在于,具体包括如下步骤:1)对输入的语音信号进行分帧:设定帧长大小,帧长范围为10~30ms,根据设定对输入的语音信号进行分帧;2)根据自相关函数公式进行每帧语音信号自相关函数计算,根据互相关函数公式进行每帧语音信号与上一帧语音信号互相关函数计算;3)求取分帧每帧语音信号的自相关函数或互相关函数的最大值;4)计算一秒内自相关函数或互相关函数的最大值方差,任取自相关函数的最大值的方差或互相关函数的最大值方差,设置一个阈值常数Th,当最大值方差大于Th时,便判定为语音,最大值方差小于Th时,便判定为噪声;5)进行下一秒内自相关函数或互相关函数的最大值方差,同步骤4)进行同样判断方法判定噪声,直到步骤1)分帧后的输入语音信号全部判定完毕。

【技术特征摘要】
1.一种基于相关函数最大值的广播语音与噪声检测的方法,其特征在于,具体包括如下步骤:1)对输入的语音信号进行分帧:设定帧长大小,帧长范围为10~30ms,根据设定对输入的语音信号进行分帧;2)根据自相关函数公式进行每帧语音信号自相关函数计算,根据互相关函数公式进行每帧语音信号与上一帧语音信号互相关函数计算;3)求取分帧每帧语音信号的自相关函数或互相关函数的最大值;4)计算一秒内自相关函数或互相关函数的最大值方差,任取自相关函数的最大值的方差或互相关函数的最大值方差,设置一个阈值常数Th,当最大值...

【专利技术属性】
技术研发人员:袁三男刘虹
申请(专利权)人:上海电力学院
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1