【技术实现步骤摘要】
结合语音活性检测和滑动窗噪声估计的信噪比计算方法
本专利技术属于人工智能
,涉及语音识别,具体涉及一种结合语音活性检测和滑动窗噪声估计的信噪比计算方法。
技术介绍
语音应用场景日渐丰富,不同的应用场景往往都是伴随着噪声的。这些语音相关应用需求比如分贝检测议等工具,语音识别、阵列信号处理等等语音技术也会需要信噪比或者根据信噪比来优化体验。因此需要获取准确的信噪比估计,首先需要对背景噪声进行一个较为准确的实时估计,其次需要决定什么时候去对信噪比进行更新。
技术实现思路
为克服现有技术存在的缺陷,本专利技术公开了一种结合语音活性检测和滑动窗噪声估计的信噪比计算方法。本专利技术所述结合语音活性检测和滑动窗噪声估计的信噪比计算方法,包括以下步骤:S1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;S2.设置滑动窗,对窗内频谱的每一个频点的最小值进行持续更新;所述持续更新的具体方式为:以第一帧每个频点的频谱 ...
【技术保护点】
1.结合语音活性检测和滑动窗噪声估计的信噪比计算方法,其特征在于,包括以下步骤:/nS1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;/nS2.设置滑动窗,对窗内频谱的每一个频点的最小值进行持续更新;/n所述持续更新的具体方式为:/n以第一帧每个频点的频谱幅度
【技术特征摘要】
1.结合语音活性检测和滑动窗噪声估计的信噪比计算方法,其特征在于,包括以下步骤:
S1.对输入的带噪语音进行逐帧处理,每帧数据对其进行短时傅里叶变换后得到频谱Y(k,l),其中k为频点频率,l为帧数;
S2.设置滑动窗,对窗内频谱的每一个频点的最小值进行持续更新;
所述持续更新的具体方式为:
以第一帧每个频点的频谱幅度平方值之和作为背景能量初始值;从第二帧开始,该帧每个频点与该帧前且位于窗内全部帧的相同频点值进行比较并选择最小值,在求得单一频点的最小值后,对该帧逐频点更新,得到该帧全频段的背景能量最小值;
S3.求出每一帧的帧能量frame_energy和帧谱熵frame_entropy;
S4.根据帧能量frame_energy和帧谱熵frame_entropy是否同时大于各自的设定门限值额,判断是否处于语音活性检测状态;
S5.处于语音活性检测状态时,进行帧信噪比的求取和更新。
2.根据权利要求1所述的信噪比计算方法,其特征在于:所述步骤S2中,背景能量最小值的更新方程为:
;
其中min(k,l)为频点k的更新前最小值,frame_energy为帧能量;back_energy(l)为第l帧的背景能量;α为背景能量平滑参数,N为傅里叶变换的点数。
3.根据权利要求1所述的信噪比计算方法,其特征在于:所述步骤S3中;第l帧的帧能量
;
帧谱熵fram...
【专利技术属性】
技术研发人员:胡岸,何云鹏,许兵,
申请(专利权)人:成都启英泰伦科技有限公司,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。