基于啸叫音自动识别的远程会议控制方法及装置制造方法及图纸

技术编号:13773031 阅读:137 留言:0更新日期:2016-09-29 21:54
本发明专利技术公开了一种基于啸叫音自动识别的远程会议控制方法及装置,此方包括:终端采集声音输入信号;提取所述声音输入信号的时域包络信号并计算所述声音输入信号在预设频率以上的频带部分的能量占比,所述终端判断所述时域包络信号具有周期性并且所述能量占比大于或等于预定阈值时执行静音操作。本发明专利技术可以从根本上消除啸叫音对音视频会议的进程的影响,保证音视频会议的通话质量,提高用户的使用体验。

【技术实现步骤摘要】

本专利技术涉及本专利技术涉及一种语音通信领域的噪声消除技术,特别是对发送端音频信号进行噪声消除的技术,可应用于单对单音频通话及多方音频通话领域。
技术介绍
人们在同时使用话筒和扬声器的时候,比如在剧场表演时、在会议厅开会时、在卡拉OK歌唱时,常常会遇到啸叫的现象,啸叫出现时,扬声器会发出刺耳的尖叫声,这将严重影响用户的使用体验。随着移动互联网覆盖范围的扩大,人们越来越习惯使用移动终端实现以前需要使用固定设备才能完成的事情,例如使用手机作为会议终端参加远程会议,但是在使用时,如果开启免提模式,就很容易出现啸叫的现象,一旦出现,往往会显著干扰会议质量。为了降低啸叫现象的干扰,技术人员采用各种办法,例如移频法、中心削波法、梳状滤波法、话筒阵列等,这些方法的思路基本为破坏啸叫产生的条件、防止啸叫产生,但现实情况是因为话筒和耳机不一定配套使用(例如多部手机同时开启外放),仍然无法根本上避免啸叫的产生,在进行音频或视频会议时仍然会因为啸叫音影响会议的进程。
技术实现思路
为了解决现有技术中无法从根本上消除啸叫音对音视频会议的进程影响的问题,本专利技术提供了基于啸叫音自动识别的远程会议控制方法及装置。本专利技术提供的基于啸叫音自动识别的远程会议控制方法,包括:步骤1,终端采集声音输入信号;步骤2,所述终端提取所述声音输入信号的时域包络信号并计算所述声音输入信号在预设频率以上的频带部分的能量占比,判断所述时域包络信号具有周期性并且所述能量占比大于或等于预定阈值时执行静音操作。上述基于啸叫音自动识别的远程会议控制方法还具有以下特点:步骤2包括:所述终端提取所述声音输入信号的时域包络信号,检测所述时域包络信号是否具有周期性,在所述时域包络信号具有周期性时计算所述声音输入信号在预设频率以上的频带部分的能量占比,在能量占比大于或等于预定阈值时,执行静音操作。上述基于啸叫音自动识别的远程会议控制方法还具有以下特点:所述方法还包括:在所述时域包络信号不具有周期性时,所述终端对所述声音输入信号编码后向服务器发送;所述方法还包括:所述能量占比小于所述预定阈值时,所述终端对所述声音输入信号编码后向服务器发送。上述基于啸叫音自动识别的远程会议控制方法还具有以下特点:所述检测所述时域包络信号是否具有周期性包括:使用信号相关法或正交变换法检测所述时域包络信号是否具有周期性。上述基于啸叫音自动识别的远程会议控制方法还具有以下特点:所述预设频率为500至3500赫兹之间的值,或者所述方法还包括设置预设频率的初始值,并根据下述方法更新所述预设频率:确定每个语音编码帧周期内的声音输入信号的频域信号的峰值,如果在一个啸叫检测周期内所述峰值所对应的频率位于频宽小于预设频率宽度的频率段内的时长大于预设时长,则将此频率值作为更新后的预设频率。本专利技术提供的基于啸叫音自动识别的远程会议控制装置,应用于终端中,包括:采集模块、时域包络信号提取模块、计算模块、判断模块、控制模块;所述采集模块用于采集声音输入信号;所述时域包络信号提取模块用于提取所述声音输入信号的时域包络信号;所述计算模块用于计算所述声音输入信号在预设频率以上的频带部分的能量占比;所述判断模块用于判断所述时域包络信号是否具有周期性以及所述能量占比是否大于或等于预定阈值;所述控制模块用于在所述判断模块判定所述时域包络信号具有周期性并且所述能量占比大于或等于预定阈值时,对所述终端执行静音操作。上述基于啸叫音自动识别的远程会议控制装置还具有以下特点:所述装置还包括编码模块和发送模块;所述控制模块还用于所述判断模块判定所述时域包络信号不具有周期性时或所述能量占比小于预定阈值时,控制编码模块对所述声音输入信号进行编码,控制所述发送模块向服务器发送所述编码模块编码后的数据。本专利技术提供的基于啸叫音自动识别的远程会议控制装置,包括:服务器接收远程会议中一通话方中至少一个终端发送的声音输入信号;对每个终端执行啸叫音识别过程,包括:提取终端的声音输入信号的时域包络信号并计算所述声音输入信号在预设频率以上的频带部分的能量占比,在所述时域包络信号具有周期性并且所述能量占比大于或等于预定阈值时,判定此终端的声音输入信号中具有啸叫音;否则,判定此终端的声音输入信号中不具有啸叫音;所述服务器将声音输入信号不具有啸叫音的各终端的声音输入信号进行混合并编码后发送至所述通话方的对端通话方。上述基于啸叫音自动识别的远程会议控制方法还具有以下特点:所述预设频率为500至3500赫兹之间的值,或者所述方法还包括设置预设频率的初始值,并根据下述方法更新所述预设频率:确定每个语音编码帧周期内的声音输入信号的频域信号的峰值,如果在一个啸叫检测周期内所述峰值所对应的频率位于频宽小于预设频率宽度的频率段内的时长大于预设时长,则将此频率值作为更新后的预设频率。本专利技术提供的基于啸叫音自动识别的远程会议控制装置,应用于服务器中,包括:接收模块、时域包络信号提取模块、计算模块、判断模块、控制
模块、编码模块、发送模块;所述接收模块接收远程会议中一通话方中至少一个终端发送的声音输入信号;所述时域包络信号提取模块用于提取所述各终端的所述声音输入信号的时域包络信号;所述计算模块用于计算所述终端的声音输入信号在预设频率以上的频带部分的能量占比;所述判断模块用于判断所述终端的声音输入信号的时域包络信号是否具有周期性并且所述能量占比是否大于或等于预定阈值;所述控制模块用于在所述判断模块判定终端的声音输入信号的时域包络信号具有周期性并且能量占比大于或等于预定阈值时,判定此终端的声音输入信号中具有啸叫音,否则判定此终端的声音输入信号中不具有啸叫音;还用于将声音输入信号不具有啸叫音的各终端的声音输入信号进行混合,控制编码模块对混合后的声音输入信号进行编码,控制发送模块将编码后的信号发送至所述通话方的对端通话方。本专利技术可以从根本上消除啸叫音对音视频会议的进程的影响,保证音视频会议的通话质量,提高用户的使用体验。附图说明构成本专利技术的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是实施例一中基于啸叫音自动识别的远程会议控制方法的流程图;图2是实施例一中一种典型的基于啸叫音自动识别的远程会议控制方法的流程图;图3是实施例二中应用于服务器的基于啸叫音自动识别的远程会议控制装置的结构图;图4是实施例三中基于啸叫音自动识别的远程会议控制方法的流程图;图5是实施例四中应用终端的基于啸叫音自动识别的远程会议控制装置的结构图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。本专利技术的实施例一和实施例二对应于在终端侧进行啸叫音自动识别并在终端侧控制终端采集到的声音信号的方式;实施例三和实施例四对应于在服务器侧进行啸叫音自动识别并在服务器侧控制各终端的声音信号的方式。实施本文档来自技高网
...

【技术保护点】
基于啸叫音自动识别的远程会议控制方法,其特征在于,包括:步骤1,终端采集声音输入信号;步骤2,所述终端提取所述声音输入信号的时域包络信号并计算所述声音输入信号在预设频率以上的频带部分的能量占比,判断所述时域包络信号具有周期性并且所述能量占比大于或等于预定阈值时执行静音操作。

【技术特征摘要】
1.基于啸叫音自动识别的远程会议控制方法,其特征在于,包括:步骤1,终端采集声音输入信号;步骤2,所述终端提取所述声音输入信号的时域包络信号并计算所述声音输入信号在预设频率以上的频带部分的能量占比,判断所述时域包络信号具有周期性并且所述能量占比大于或等于预定阈值时执行静音操作。2.如权利要求1所述的基于啸叫音自动识别的远程会议控制方法,其特征在于,所述步骤2包括:所述终端提取所述声音输入信号的时域包络信号,检测所述时域包络信号是否具有周期性,在所述时域包络信号具有周期性时计算所述声音输入信号在预设频率以上的频带部分的能量占比,在能量占比大于或等于预定阈值时,执行静音操作。3.如权利要求1或2所述的基于啸叫音自动识别的远程会议控制方法,其特征在于,所述方法还包括:在所述时域包络信号不具有周期性时,所述终端对所述声音输入信号编码后向服务器发送;所述方法还包括:所述能量占比小于所述预定阈值时,所述终端对所述声音输入信号编码后向服务器发送。4.如权利要求1或2所述的基于啸叫音自动识别的远程会议控制方法,其特征在于,所述检测所述时域包络信号是否具有周期性包括:使用信号相关法或正交变换法检测所述时域包络信号是否具有周期性。5.如权利要求1或2所述的基于啸叫音自动识别的远程会议控制方法,其特征在于,所述预设频率为500至3500赫兹之间的值,或者,所述方法还包括设置预设频率的初始值,并根据下述方法更新所述预设频率:确定每个语音编码帧周期内的声音输入信号的频域信号的峰值,如果在一个啸叫检测周期内所述峰值所对应的频率位于频宽小于预设频率宽度的频率段内的时长大于预设时长,则将此频率值作为更新后的预设频率。6.基于啸叫音自动识别的远程会议控制装置,其特征在于,应用于终
\t端中,包括:采集模块、时域包络信号提取模块、计算模块、判断模块、控制模块;所述采集模块用于采集声音输入信号;所述时域包络信号提取模块用于提取所述声音输入信号的时域包络信号;所述计算模块用于计算所述声音输入信号在预设频率以上的频带部分的能量占比;所述判断模块用于判断所述时域包络信号是否具有周期性以及所述能量占比是否大于或等于预定阈值;所述控制模块用于在所述判断模块判定所述时域包络信号具有周期性并且所述能量占比大于或等于预定阈值时,对所述终端执行静音操作。7.如权利要求6所述的基于啸叫音自动识别的远程会...

【专利技术属性】
技术研发人员:江周平徐家骏代金良
申请(专利权)人:一块互动北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1