一种啸叫场景识别方法及设备技术

技术编号:14765732 阅读:117 留言:0更新日期:2017-03-08 10:07
本申请公开了一种啸叫场景识别方法,包括:对检测窗内的每个语音帧,在频域上提取能量谱信息,并根据能量谱信息判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。本申请还公开了一种啸叫场景识别设备。应用本申请公开的技术方案,能够提高啸叫检测的准确率,从而适配后续的啸叫抑制处理。

【技术实现步骤摘要】

本申请涉及通信
,特别涉及一种啸叫场景识别方法及设备
技术介绍
行业终端的语音业务形式主要为集群模式、直通模式(DMO)等业务,并且这类业务主要使用外放模式。由于行业终端大部分工作在背景噪声较大的户外或厂房,要求音量大,因此终端的上下行音量增益通常调得较大,声音通过环路增益放大后,能量不断累积将形成啸叫,而啸叫严重影响语音业务的正常使用,对客户感知引起极大的不适,因此对啸叫场景进行识别具有很重要的意义。然而,目前行业终端对啸叫场景识别的解决方案并不成熟,尚处于摸索阶段,大量识别方案普遍存在效率低、识别不准确的问题,严重影响了啸叫抑制的整体性能。
技术实现思路
本申请提供了一种啸叫场景识别方法和设备,以提高啸叫检测的准确率。本申请提供的一种啸叫场景识别方法,包括:对检测窗内的每个语音帧,在频域上提取能量谱信息,并根据能量谱信息判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。较佳的,所述根据能量谱信息判断是否存在啸叫特征包括:判断所述帧的高频区域的平均能量与低频区域的平均能量之比是否大于设置的高低频比值门限,如果大于,判定存在啸叫特征,否则,判定不存在啸叫特征。较佳的,以1KHZ作为高频区域和低频区域的划分标准。较佳的,所述啸叫场景条件为:检测窗内啸叫帧的数量大于或者等于设置的数量门限。较佳的,所述数量门限与检测窗内包含的语音帧的数量成正比,并满足数量门限小于或者等于检测窗内包含的语音帧的数量。本申请还提供了一种啸叫场景识别设备,包括:啸叫帧判决模块和啸叫场景判决模块,其中:啸叫帧判决模块,用于对检测窗内的每个语音帧,在频域上提取能量谱信息,并根据能量谱信息判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;啸叫场景判决模块,用于判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。由上述技术方案可见,本申请提供的啸叫场景识别方法和设备,首先根据频域上提取的能量谱信息分别判断检测窗内的每个语音帧中是否存在啸叫特征,如果存在,确定该帧为啸叫帧;然后判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景,通过本申请技术方案能够有效的识别啸叫语音特征,提高啸叫检测的准确率,从而适配后续的啸叫抑制处理。附图说明图1为本专利技术一较佳啸叫场景识别方法的流程示意图;图2为没有啸叫现象的频域波形示意图;图3为存在啸叫现象的频域波形示意图;图4为本专利技术一较佳设备的组成结构示意图。具体实施方式为使本申请的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本申请作进一步详细说明。图1为本专利技术一较佳啸叫场景识别方法的流程示意图,该方法包括:首先,对检测窗内的每个语音帧,在频域上提取能量谱信息,并根据能量谱信息判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;然后,通过滑窗机制判断当前检测窗是否满足啸叫场景条件,如果满足,判决当前为啸叫场景,否则,判决当前为非啸叫场景。一般来说,啸叫声在时域上能量比较集中,存在饱和现象,而且主要在高频比较集中的区域,而语音主要存在低频区域。图2为没有啸叫现象的频域波形示意图;图3为存在啸叫现象的频域波形示意图。图2和图3中,横轴表示频率,单位为HZ,纵轴表示功率,单位为dB。如图3,在高频区域存在一个比较明显的宽频啸叫,而低频区域的语音分量相对较低。本申请根据高低频能量差异这一特征识别啸叫帧,因此提出啸叫帧需要满足以下条件:其中,Phigh_freq表示当前帧的高频区域的平均能量;Plow_freq表示当前帧的低频区域的平均能量;表示当前帧的高频区域的平均能量与低频区域的平均能量之比(简称高低频能量比);high_low_ratio_thd为高低频比值门限,取值可以根据不同平台的特点具体进行设置,推荐值为0.25,高低频能量比大于高低频比值门限则认为当前帧为啸叫帧,并进行标记。高频区域和低频区域的划分根据不同平台具体设置,考虑到语音主要集中在1KHZ以下,较佳地,可以将小于1KHZ的区域设置为低频区域,大于1KHZ的区域设置为高频区域。对于啸叫声场景,啸叫现象会持续产生,并在连续多个语音帧存在啸叫特征,即时域特征,本申请基于对这一特点的分析,提出如前所述的基于滑窗的啸叫场景判决方法。例如:假设滑窗大小为HORING_DURATION,该滑窗包含最近HORING_DURATION个语音帧,本申请分别判断这HORING_DURATION个语音帧是否为啸叫帧,然后判断HORING_DURATION个语音帧中啸叫帧的数量是否满足以下条件:啸叫帧有效的语音帧数>=PEAK_NUM_THD若满足则判断进入啸叫场景,反之不能进入啸叫场景。其中,数量门限PEAK_NUM_THD与HORING_DURATION成正比,需要满足PEAK_NUM_THD<=HORING_DURATION。对应于上述方法,本申请还提供了一种啸叫场景识别设备,其组成结构如图4所示,包括:啸叫帧判决模块和啸叫场景判决模块,其中:啸叫帧判决模块,用于对检测窗内的每个语音帧,在频域上提取能量谱信息,并根据能量谱信息判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;啸叫场景判决模块,用于判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。本文档来自技高网...
一种啸叫场景识别方法及设备

【技术保护点】
一种啸叫场景识别方法,其特征在于,包括:对检测窗内的每个语音帧,在频域上提取能量谱信息,并根据能量谱信息判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。

【技术特征摘要】
1.一种啸叫场景识别方法,其特征在于,包括:对检测窗内的每个语音帧,在频域上提取能量谱信息,并根据能量谱信息判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。2.根据权利要求1所述的方法,其特征在于:所述根据能量谱信息判断是否存在啸叫特征包括:判断所述帧的高频区域的平均能量与低频区域的平均能量之比是否大于设置的高低频比值门限,如果大于,判定存在啸叫特征,否则,判定不存在啸叫特征。3.根据权利要求2所述的方法,其特征在于:以1KHZ作为高频区域和低频区域的划分标准。4.根据权利要求1...

【专利技术属性】
技术研发人员:徐绍君王亮鲜柯
申请(专利权)人:成都鼎桥通信技术有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1