一种啸叫场景识别方法及设备技术

技术编号:15447817 阅读:59 留言:0更新日期:2017-05-29 22:21
本申请公开了一种啸叫场景识别方法,包括:对检测窗内的每个语音帧,根据啸叫帧条件判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。本申请还公开了一种啸叫场景识别设备。应用本申请公开的技术方案,能够提高啸叫检测的准确率,从而适配后续的啸叫抑制处理。

A whistling scene recognition method and device

The invention discloses a howling scene recognition method, including: for each speech frame detection window, according to the frame conditions to determine whether there is howling howling features, if present, determine the frame for the whistler frame; judge whether the current detection window to meet howling scene conditions, if satisfied, the judgment of current as the howling scene, otherwise, the decision for non howling scene. The present application also discloses a whistling scene recognition device. By applying the technical proposal disclosed by the utility model, the accuracy of the whistle detection can be improved so that a subsequent howling suppression process can be adapted.

【技术实现步骤摘要】
一种啸叫场景识别方法及设备
本申请涉及通信
,特别涉及一种啸叫场景识别方法及设备。
技术介绍
行业终端的语音业务形式主要为集群模式、直通模式(DMO)等业务,并且这类业务主要使用外放模式。由于行业终端大部分工作在背景噪声较大的户外或厂房,要求音量大,因此终端的上下行音量增益通常调得较大,声音通过环路增益放大后,能量不断累积将形成啸叫,而啸叫严重影响语音业务的正常使用,对客户感知引起极大的不适,因此对啸叫场景进行识别具有很重要的意义。然而,目前行业终端对啸叫场景识别的解决方案并不成熟,尚处于摸索阶段,大量识别方案普遍存在效率低、识别不准确的问题,严重影响了啸叫抑制的整体性能。
技术实现思路
本申请提供了一种啸叫场景识别方法和设备,以提高啸叫检测的准确率。本申请提供的一种啸叫场景识别方法,包括:对检测窗内的每个语音帧,根据啸叫帧条件判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。较佳的,所述根据啸叫帧条件判断是否存在啸叫特征包括:A、判断所述语音帧中功率最大的点的频率是否大于设定的第一门限,如果是,继续执行B,否则,结束判断过程;B、记所述功率最大的点的位置为Po_peak,以Po_peak为中心按照设定的宽度划定Peak_window窗,并在Peak_window窗的两侧分别划定before_window窗和after_window窗,其中,before_window窗和after_window窗的宽度与Peak_window窗相同或不同;C、判断Po_peak的功率与before_window窗和after_window窗的平均功率是否满足:如果满足,继续执行D,否则,结束判断过程;其中Pv为预先设定的值;D、判断Peak_window窗的平均功率与before_window窗和after_window窗的平均功率是否满足:如果满足,则判定该语音帧中存在啸叫特征。较佳的,所述啸叫场景条件为:检测窗内啸叫帧的数量大于或者等于设置的数量门限。较佳的,所述啸叫场景条件分为:长检测窗机制和短检测窗机制下的啸叫场景条件,其中,长检测窗机制的检测窗宽度大于短检测窗机制的检测窗宽度。较佳的,所述数量门限与检测窗内包含的语音帧的数量成正比,且数量门限小于或者等于检测窗内包含的语音帧的数量。本申请还提供了一种啸叫场景识别设备,包括:啸叫帧判决模块和啸叫场景判决模块,其中:所述啸叫帧判决模块,用于对检测窗内的每个语音帧,根据啸叫帧条件判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;所述啸叫场景判决模块,用于判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。由上述技术方案可见,本申请提供的啸叫场景识别方法和设备,首先根据啸叫帧条件分别判断检测窗内的每个语音帧中是否存在啸叫特征,如果存在,确定该帧为啸叫帧;然后判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景,通过本申请技术方案能够有效的识别啸叫语音特征,提高啸叫检测的准确率,从而适配后续的啸叫抑制处理。附图说明图1为本专利技术一较佳啸叫场景识别方法的流程示意图;图2为存在啸叫现象的时域波形示意图;图3为存在啸叫现象的频域波形示意图;图4为本专利技术判断啸叫点的示意图;图5为本专利技术一较佳设备的组成结构示意图。具体实施方式为使本申请的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本申请作进一步详细说明。图1为本专利技术一较佳啸叫场景识别方法的流程示意图,该方法包括:首先,对检测窗内的每个语音帧,根据啸叫帧条件判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;然后,判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。一般来说,啸叫声在时域上能量比较集中,存在饱和现象,而且主要集中在某一段比较集中的频域,如图2中椭圆所示区域。图3则示出了两个啸叫点。图2中,横轴表示时间,单位为秒,纵轴表示功率,单位为mW;图3中,横轴表示频率,单位为Hz,纵轴表示功率,单位为dB。本申请根据啸叫点能量主要集中在某一个到多个频点中这一特征识别啸叫帧,提出啸叫帧需要满足以下条件:(1)啸叫点的频率大于设定的门限min_frequency。(2)以啸叫点为中心的peak_window窗内啸叫点的功率最大,记啸叫点的位置为Po_peak。(3)啸叫点的功率与before_window窗和after_window窗的平均功率满足:其中,Pd为预先设定的值,其推荐值为10。(4)Peak_window窗的平均功率与before_window窗和after_window窗的平均功率满足:其中,Peak_window窗、before_window窗和after_window窗的关系如图4所示。图4所示示例中,Peak_window窗、before_window窗和after_window窗的宽度相同,before_window窗和after_window窗分别位于Peak_window窗的两侧。在实际应用中,Peak_window窗、before_window窗和after_window窗的宽度可以相同或不同,宽度的的取值范围推荐值为5~12个采样点。若当前语音帧满足上述条件,则判决当前语音帧存在啸叫点,可将当前语音帧判决为啸叫帧。基于上述啸叫帧条件,判断某一语音帧是否存在啸叫特征的具体过程为:A、判断语音帧中功率最大的点的频率是否大于设定的第一门限(即如前所述的min_frequency),如果是,继续执行B,否则,结束判断过程;B、记所述功率最大的点的位置为Po_peak,以Po_peak为中心按照设定的宽度划定Peak_window窗,并在Peak_window窗的两侧分别划定before_window窗和after_window窗,其中,before_window窗和after_window窗的宽度与Peak_window窗可以相同或不同,宽度的的取值范围推荐值为5~12个采样点;C、判断Po_peak的功率与before_window窗和after_window窗的平均功率是否满足:如果满足,继续执行D,否则,结束判断过程;其中,Pv为预先设定的值,其推荐值为5;D、判断Peak_window窗的平均功率与before_window窗和after_window窗的平均功率是否满足:如果满足,则判定该语音帧中存在啸叫特征,即:该语音帧为啸叫帧。对于啸叫声场景,啸叫现象会持续产生,并在连续多个语音帧存在啸叫特征,即时域特征,本申请基于对这一特点的分析,提出如前所述的基于滑窗的啸叫场景判决方法,同时,采用长检测窗机制和短检测窗机制。短检测窗机制是通过分析短周期内产生啸叫点的语音帧概率来判断是否进入啸叫场景,主要用于判断突发强烈的啸叫声;而长检测窗机制是通过分析长周期内产生啸叫点的语音帧概率来判断是否进入啸叫场景,主要用于判断于缓慢变化的啸叫声。长检测窗机制与短检测窗机制的算法和处理基本一致,主要区别在于门限和检测窗大小不同,本文以短检测窗机制为本文档来自技高网...
一种啸叫场景识别方法及设备

【技术保护点】
一种啸叫场景识别方法,其特征在于,包括:对检测窗内的每个语音帧,根据啸叫帧条件判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。

【技术特征摘要】
1.一种啸叫场景识别方法,其特征在于,包括:对检测窗内的每个语音帧,根据啸叫帧条件判断是否存在啸叫特征,如果存在,确定该帧为啸叫帧;判断当前检测窗是否满足啸叫场景条件,如果满足,则判决当前为啸叫场景,否则,判决当前为非啸叫场景。2.根据权利要求1所述的方法,其特征在于,所述根据啸叫帧条件判断是否存在啸叫特征包括:A、判断所述语音帧中功率最大的点的频率是否大于设定的第一门限,如果是,继续执行B,否则,结束判断过程;B、记所述功率最大的点的位置为Po_peak,以Po_peak为中心按照设定的宽度划定Peak_window窗,并在Peak_window窗的两侧分别划定before_window窗和after_window窗,其中,before_window窗和after_window窗的宽度与Peak_window窗相同或不同;C、判断Po_peak的功率与before_window窗和after_window窗的平均功率是否满足:如果满足,继续执行D,否则,结束判断过程;其中Pv为预先设定的值;...

【专利技术属性】
技术研发人员:徐绍君王亮鲜柯
申请(专利权)人:成都鼎桥通信技术有限公司
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1