音频系统中语音啸叫的处理方法及系统技术方案

技术编号:14759074 阅读:105 留言:0更新日期:2017-03-03 06:36
本发明专利技术公开了音频系统中语音啸叫的处理方法及系统,本方案通过对语音信号在頻域进行实时处理,分析检查信号是否含有人声音的有效信号;当没有检测到人声信号时,说明背景可能包含较多的杂音或啸叫,在頻域清除信号后转换回时域传输。本方案仅当有噪声或啸叫的语音时做处理,不会影响正常通话质量;在发送端录音后、接收端播放前添加处理,不影响已有系统的硬件或软件设计。

【技术实现步骤摘要】

本专利技术涉及音频系统处理技术,尤其涉及音频系统中语音啸叫的处理技术。
技术介绍
随着数字网络的发展,出现了众多的手机语音对讲系统:通过手机软件可以非常方便的实现传统的对讲机。发送端手机通过麦克获取语音信号并通过数据网络传递到接听端,接听端通过扬声器播放接收到的声音信号,这样一个基本的语音对讲系统就形成了。但是在实际应用过程中,如果在室内或近距离通话,由于接听端的扬声器不断的发出声音,同时也被发送端的麦克接收到,不断循环产生了声音的自激,出现刺耳的啸叫音。这种啸叫音对于系统的体验效果破坏非常严重,因此需要一种能有效过滤掉啸叫声音的技术。在现有的技术中,处理语音啸叫的方法有很多,如使用自适应滤波器减少增益或陷波器;如判断信号中心频率是否在啸叫发生的频率范围,如果发现在啸叫发生频率,则激活滤波器过滤特定的频率;或者直接使用陷波器滤掉特定的啸叫频率。传统的音频系统啸叫处理技术多是在信号增益上做处理,当检测到可能有啸叫后,对音频信号减小增益,避免语音系统回路出现正反馈自激形成啸叫。减小增益的方法会同时影响正常语音,使接收端语音信号变小,而且由于啸叫没有被完全过滤,仍可能会继续自激产生更严重的啸叫,处理效果并不理想。直接使用陷波器过滤掉特定频率的方法可以有效的去除某种啸叫,但是随着音频系统回路的不断反馈,啸叫声音会不断变化,即频率中心不断转移。而使用自适应的陷波器处理,则可能会过滤掉正常的声音信息,效果仍不理想。
技术实现思路
针对现有音频系统啸叫处理技术所存在的问题,需要新的音频系统啸叫处理技术,以提高处理效果。由此,本专利技术所要解决的技术问题是提供一种音频系统中语音啸叫的处理方法及系统,以提高啸叫处理效果。为了解决上述技术问题,本专利技术提供的音频系统中语音啸叫的处理方法,其通过检测人声音及啸叫音在頻域的特征,确定是否发生啸叫音,并在啸叫音发生时移除其所有頻域分量。优选的,所述处理方法通过检测语音信号在人声頻域内分布是否均匀,均匀则为含有人声音的正常语音信号,否则为背景噪音或啸叫音。优选的,所述处理方法具体包括:对语音信号在頻域进行实时处理,分析检查语音信号是否含有人声音的正常语音信号;当没有检测到人声信号时,确定为背景噪音或啸叫信号,在頻域清除该信号后转换回时域传输。优选的,所述处理方法通过检查分析语音信号在人声頻域内的强度特征,确定信号在人声頻域内分布是否均匀。优选的,所述处理方法针对语音信号在人声頻域内每段频率分量,遍历每一段频率分量的能量强度,当能量强大于预先测量的强度时计数,当计数达到预先测量的有效人声计数时,确定语音信号为正常语音信号,不做任何处理;当计数没有达到预先测量的有效人声计数时,说明语音信号的分布不均匀,确定为啸叫信号,对頻域信号清零处理并转化回时域来消除啸叫信号。优选的,所述处理方法中通过如下公式确定人声頻域的位置:low=(int)(size*1000f*2/rate),其中,low为人声音低频的位置,rate为输入音频样本采样率,size为采样大小。为了解决上述技术问题,本专利技术提供的音频系统中语音啸叫的处理系统包括:FFT模块,所述FFT模块用于将音频样本进行快速傅立叶变换转到頻域;声音检测模块,所述声音检测模块对变换到频域的信号进行声音检测,确定信号在人声頻域内分布是否均匀;声音处理模块,所述声音处理模块根据声音检测模块的检测结果对信号进行消除啸叫处理;IFFT模块,所述IFFT模块对经声音处理模块处理的信号进行反傅立叶变换将信号转换回到时域。优选的,所述声音检测模块通过检查分析语音信号在人声頻域内的强度特征,确定信号在人声頻域内分布是否均匀。优选的,所述声音检测模块检查语音信号在人声頻域内每段频率分量,并将每段频率分量的能量强度与预先测量的强度对比,在高于预先测量强度时计数;当计数达到预先测量的有效人声计数时,确定信号在人声頻域内分布均匀;当计数未达到预先测量的有效人声计数时,确定信号在人声頻域内分布集中。优选的,所述声音处理模块对在人声頻域内分布均匀的信号不做处理;对在人声頻域内分布不均匀的信号,移除其所有頻域分量。优选的,所述处理系统中还包括初始化模块,所述初始化模块以确定人声頻域的位置。相对与已有的处理方法,本专利技术提供的音频系统啸叫处理方案具有如下优点:1)对不包含有效声音的音频完全过滤,避免了噪音和啸叫在语音回路中再次传递;2)不会对正常的音频信号做任何处理,可以保证正常语音信号增益不变且没有任何频率和能量损失;3)实施简单,容易操作,不需要任何硬件和软件结构改变,可以快速的部署进现有的语音系统;4)在真实的实践应用中测试具有非常理想的啸叫和噪音处理效果;5)仅当有噪声或啸叫的语音时做处理,不会影响正常通话质量;6)本方案在发送端录音后、接收端播放前添加处理,不影响已有系统的硬件或软件设计。附图说明以下结合附图和具体实施方式来进一步说明本专利技术。图1为本专利技术实例中啸叫处理模型示意图;图2为本专利技术实例中啸叫处理算法流程图;图3为本专利技术实例中增加啸叫处理后的一个音频系统模型;图4为一个没有经过处理的对讲语音系统啸叫音频样本的频谱特征图;图5为一个经过本专利技术啸叫处理方案处理的对讲语音系统无啸叫音频样本的频谱特征图。具体实施方式为了使本专利技术实现的技术手段、创作特征、达成目的与功效易于明白了解,下面结合具体图示,进一步阐述本专利技术。基于大量的实验和创造性劳动,申请人发现人的声音在頻域有明显的特征:在小于1000hz的低频部分表现为分布均匀的条带(如图5所示);而啸叫信号在頻域内的明显特征:在某一段频率内集中分布(如图4所示);在此情况下,使用传统的啸叫处理方法虽然可以抑制特定频率的啸叫信号,但是在实时音频系统中,啸叫音可能会因抑制处理而发生变化,啸叫中心频率会不断的转移,这时传统的处理方法就很难达到理想的效果。为此,本专利技术通过检测人声音及啸叫音在頻域的特征,以确定是否发生啸叫音,当啸叫音发生时移除所有頻域分量,由此来消除啸叫音。对于其中,人声音在頻域的特征的检测,可通过检测语音在低频分布是否均匀,均匀则为含有人声音的正常语音信号,否则为背景噪音或啸叫音。据此方案对对音频系统中语音啸叫处理的过程如下:对语音信号在頻域进行实时处理,通过声音分析检查语音信号是否含有人声音的正常语音信号;当没有检测到人声信号时,说明背景可能包含较多的杂音或啸叫,在頻域清除该信号后转换回时域传输。本方案中检查分析语音信号中是否含有人声音信号通过检测语音在低频分布是否均匀来进行的,其具体过程如下:1)对待检测的音频样本,进行快速傅立叶变换转到頻域;2)集中处理变换后音频样本信号在人声频率范围50hz-1000hz頻域内每个频率分量,检查该音频样本信号在人声頻域内分布是否均匀,这里具体通过检查分析语音信号在人声頻域内的强度特征,以此来确定信号在人声頻域内分布是否均匀,过程如下:检测每个频率分量的能量强度px,且将每个频率分量的能量强度px与预先测量的强度p0对比,在高于预先测量强度p0时计数;当计数达到预先测量的有效人声计数c0时,则触发声音检测,说明该音频样本信号在人声頻域内分布均匀,为含有人声音的正常语音信号,对信号不做任何处理;当计数未达到预先测量的有效人声计数c0时,则说明该音频样本信号在人声頻域内本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/62/201610946477.html" title="音频系统中语音啸叫的处理方法及系统原文来自X技术">音频系统中语音啸叫的处理方法及系统</a>

【技术保护点】
音频系统中语音啸叫的处理方法,其特征在于,所述处理方法通过检测人声音及啸叫音在頻域的特征,确定是否发生啸叫音,并在啸叫音发生时移除其所有頻域分量。

【技术特征摘要】
1.音频系统中语音啸叫的处理方法,其特征在于,所述处理方法通过检测人声音及啸叫音在頻域的特征,确定是否发生啸叫音,并在啸叫音发生时移除其所有頻域分量。2.根据权利要求1所述的音频系统中语音啸叫的处理方法,其特征在于,所述处理方法具体包括:对语音信号在頻域进行实时处理,分析检查语音信号是否含有人声音的正常语音信号;当没有检测到人声信号时,确定为背景噪音或啸叫信号,在頻域清除该信号后转换回时域传输。3.根据权利要求2所述的音频系统中语音啸叫的处理方法,其特征在于,所述处理方法通过检测语音信号在人声頻域内分布是否均匀,均匀则为含有人声音的正常语音信号,否则为背景噪音或啸叫音。4.根据权利要求3所述的音频系统中语音啸叫的处理方法,其特征在于,所述处理方法通过检查分析语音信号在人声頻域内的强度特征,确定信号在人声頻域内分布是否均匀。5.根据权利要求4所述的音频系统中语音啸叫的处理方法,其特征在于,所述处理方法针对语音信号在人声頻域内每段频率分量,遍历每一段频率分量的能量强度,当能量强大于预先测量的强度时计数,当计数达到预先测量的有效人声计数时,确定语音信号为正常语音信号,不做任何处理;当计数没有达到预先测量的有效人声计数时,说明语音信号的分布不均匀,确定为啸叫信号,对頻域信号清零处理并转化回时域来消除啸叫信号。6.根据权利要求3或4或5所述的音频系统中语音啸叫的处理方法,其特征在于,所述处理方法中通过如下公式确定人声頻域的位置:low=(int)(size*1000f*2/r...

【专利技术属性】
技术研发人员:牛国富郑富强薛钢
申请(专利权)人:上海数果科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1