基于相关函数最大值的广播语音与噪声检测的方法技术

技术编号：21161641 阅读：24 留言：0更新日期：2019-05-22 08:28

本发明专利技术涉及一种基于相关函数最大值的广播语音与噪声检测的方法，通过对语音信号进行分帧；根据自(互)相关函数公式进行每帧语音信号相关函数计算；求取分帧每帧语音信号的自(互)相关函数或互相关函数的最大值；计算一秒内自(互)相关函数的最大值方差，设置一个阈值常数Th，当最大值方差大于Th时，便判断为语音，最大值方差小于Th时，便判定为噪声。此方法将语音中噪声识别区分出，便于提升广播或其他声音处理中的声音的清晰度。

Detection of Broadcast Speech and Noise Based on Maximum Relevance Function

The present invention relates to a method for detecting broadcasting speech and noise based on maximum correlation function, by subdividing the speech signal into frames, calculating the correlation function of each frame of speech signal according to the formula of self-correlation function, calculating the maximum auto-correlation function or cross-correlation function of each frame of speech signal in subframe, calculating the maximum variance of the auto-correlation function in one second, and setting up Setting a threshold constant Th, when the maximum variance is greater than Th, it can be judged as speech, and when the maximum variance is less than Th, it can be judged as noise. This method can distinguish the noise in speech and improve the clarity of voice in broadcasting or other sound processing.

全部详细技术资料下载

【技术实现步骤摘要】
基于相关函数最大值的广播语音与噪声检测的方法
本专利技术涉及一种语音识别技术，特别涉及一种基于相关函数最大值的广播语音与噪声检测的方法。
技术介绍
调频广播中经常听到“呲呲”的声音，是一种叫做似高斯噪声中高幅值部分的失真引起的。这种典型的现象就是听众没有将收音机准确的调到某个台。现实生活中，一些人的声音和这些噪声极为相似，因此，使用傅里叶变换就很难将这些噪声和语音区分开来。
技术实现思路
本专利技术是针对调频广播中嘈杂声难识别区分的问题，提出了一种基于相关函数最大值的广播语音与噪声检测的方法，正确将噪声识别区分出。本专利技术的技术方案为：一种基于相关函数最大值的广播语音与噪声检测的方法，具体包括如下步骤：1)对输入的语音信号进行分帧：设定帧长大小，帧长范围为10～30ms，根据设定对输入的语音信号进行分帧；2)根据自相关函数公式进行每帧语音信号自相关函数计算，根据互相关函数公式进行每帧语音信号与上一帧语音信号互相关函数计算；3)求取分帧每帧语音信号的自相关函数或互相关函数的最大值；4)计算一秒内自相关函数或互相关函数的最大值方差，任取自相关函数的最大值的方差或互相关函数的最大值方差，设置一个阈值常数Th，当最大值方差大于Th时，便判断为语音，最大值方差小于Th时，便判定为噪声；5)进行下一秒内自相关函数或互相关函数的最大值方差，同步骤4)进行同样判断方法判定噪声，直到步骤1)分帧后的输入语音信号全部判定完毕。所述步骤2)中自相关函数公式为：所述互相关函数公式为：其中xi(m)为第i帧的语音信号中的第m个数据；xi-1(m)为第i-1帧的语音信号中的第m个数据；...

【技术保护点】
1.一种基于相关函数最大值的广播语音与噪声检测的方法，其特征在于，具体包括如下步骤：1)对输入的语音信号进行分帧：设定帧长大小，帧长范围为10～30ms，根据设定对输入的语音信号进行分帧；2)根据自相关函数公式进行每帧语音信号自相关函数计算，根据互相关函数公式进行每帧语音信号与上一帧语音信号互相关函数计算；3)求取分帧每帧语音信号的自相关函数或互相关函数的最大值；4)计算一秒内自相关函数或互相关函数的最大值方差，任取自相关函数的最大值的方差或互相关函数的最大值方差，设置一个阈值常数Th，当最大值方差大于Th时，便判定为语音，最大值方差小于Th时，便判定为噪声；5)进行下一秒内自相关函数或互相关函数的最大值方差，同步骤4)进行同样判断方法判定噪声，直到步骤1)分帧后的输入语音信号全部判定完毕。

【技术特征摘要】
1.一种基于相关函数最大值的广播语音与噪声检测的方法，其特征在于，具体包括如下步骤：1)对输入的语音信号进行分帧：设定帧长大小，帧长范围为10～30ms，根据设定对输入的语音信号进行分帧；2)根据自相关函数公式进行每帧语音信号自相关函数计算，根据互相关函数公式进行每帧语音信号与上一帧语音信号互相关函数计算；3)求取分帧每帧语音信号的自相关函数或互相关函数的最大值；4)计算一秒内自相关函数或互相关函数的最大值方差，任取自相关函数的最大值的方差或互相关函数的最大值方差，设置一个阈值常数Th，当最大值...

【专利技术属性】
技术研发人员：袁三男，刘虹，
申请(专利权)人：上海电力学院，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人