音频信号处理方法、装置、终端及存储介质制造方法及图纸

技术编号:25806061 阅读:24 留言:0更新日期:2020-09-29 18:40
本申请实施例公开了一种音频信号处理方法、装置、终端及存储介质,属于语音处理技术领域。该方法包括获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;计算所述帧信号的频谱平滑度;确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。本申请实施例中,通过得到频域下的帧信号并进行频谱平滑度计算,对满足预设条件的帧信号进行增益处理,提高了语音处理的精确性和处理效率。

【技术实现步骤摘要】
音频信号处理方法、装置、终端及存储介质
本申请实施例涉及语音处理技术,尤其涉及一种音频信号处理方法、装置、终端及存储介质。
技术介绍
随着终端设备硬件以及音频处理技术的发展,终端设备可以进行音频信号的播放,其中音频信号为声波的频率、幅度变化信息的载体。现有的音频信号处理算法中,如在LMS(LeastMeanSquare,最小均方误差)算法的基础上通过引入动量因子对音频信号进行处理的方式,其算法精度低、复杂度高、运算量大。
技术实现思路
本申请实施例提供了一种音频信号处理方法、装置、终端及存储介质,可以解决相关技术中,音频信号处理精度低、复杂度高、运算量大的问题。所述技术方案如下:第一方面,本申请实施例提供了一种音频信号处理方法,包括:获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;计算所述帧信号的频谱平滑度;确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。第二方面,本申请实施例还提供了一种音频信号处理装置,包括:信号预处理模块,用于获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;平滑度计算模块,用于计算所述帧信号的频谱平滑度;增益处理模块,用于确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。第三方面,本申请实施例还提供了一种终端,包括:处理器、存储器以及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如本申请实施例所述的音频信号处理方法。第四方面,本申请实施例还提供了一种包含终端可执行指令的存储介质,所述终端可执行指令在由终端处理器执行时用于执行本申请实施例所述的音频信号处理方法。本申请实施例提供的方案中,通过获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号,计算所述帧信号的频谱平滑度,确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理,提高了语音处理的精确性和处理效率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请一个示例性实施例提供的音频信号处理方法的流程图;图2是本申请另一个示例性实施例提供的音频信号处理方法的流程图;图3是本申请另一个示例性实施例提供的音频信号处理方法的流程图;图4是本申请一个示例性实施例提供的音频信号处理装置的结构框图;图5是本申请一个示例性实施例提供的终端的结构框图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。示例性的,本申请实施例所示的音频信号处理方法可以应用在终端中,该终端具备处理器、存储器。该终端可以包括服务器、电视、机顶盒、智能眼镜、智能手表、数码相机、MP4播放终端、MP5播放终端、学习机、点读机、电子词典、车载终端、虚拟现实(VirtualReality,VR)播放终端、增强现实(AugmentedReality,AR)播放终端、手机、平板电脑、膝上型电脑、台式电脑或电脑一体机等。请参考图1,图1示出了本申请一个示例性实施例提供的音频信号处理方法的流程图,该方法包括:步骤S101、获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号。音频信号为声波的频率、幅度变化信息的载体,通过音频信号可以进行音频数据的传输,音频信号可由音频信号采集装置(如麦克风)进行采集。在本申请实施例中,该音频信号可以是用户发出的语音,其可被终端集成的信号采集装置所采集,该被采集的音频信号为模拟信号。终端在采集音频信号时,如手机在免提状态下接收用户的语音,当回声消除处理不好时,或者当两台手机靠近时,同一频率的声音会进行不断叠加,在手机通话的另一端会产生刺耳是声音(即啸叫)。又如,用户通过语音聊天软件进行多人语音通话时,在回声消除技术处理失败时也会出现啸叫现象。传统的啸叫抑制算法利用最小均方算法(LMS)构建陷波器来检测和消除啸叫,但是这种算法计算量较大,存在一定的延迟,在低延迟和复杂的通话场景下,不能起到较好的效果。本申请实施例中,获取如麦克风采集的音频信号,对该音频信号进行预处理以得到其在频域下的帧信号。其中,原始的音频信号为时域信号,时域用于描述的是信号随时间变化的波形,而频域用于描述的是信号在频率方面的特性。示例性的,得到音频信号对应的频域下的帧信号的预处理方式包括对音频信号进行分帧、加窗处理,对处理结果进行傅里叶变换以得到时域的音频信号对应的频域下的帧信号。步骤S102、计算所述帧信号的频谱平滑度。本申请实施例中,在得到音频信号对应频域下的帧信号后,计算每一帧信号的频谱平滑度,其中频谱平滑度用于表征该帧信号的平滑情况,指在频率域上功率的相对变化,频谱平滑度的值越低(趋近于0)则产生啸叫的可能性越小,频谱平滑度的值越大(趋近于1),则该帧信号为啸叫信号的可能性越大,当确定出该帧信号为啸叫信号(即会产生啸叫现象)时需要进行啸叫抑制处理以避免啸叫现象的产生。本申请一个实施例中,在得到音频信号对应的频域下的帧信号X(m,k)后,将所述帧信号X(m,k)划分为l个频带的信号Xb(m,k),其中b为第b个频带,b=0,1,2,3....l,示例性的l可以是20,bu为该频带的上频点,bl为该频带的下频点,示例性的每个频带假设有25个频点,bu为该频带的第1个频点,bl为该频带的第25个频点,其中每个频带的宽度为fs/l,每个频带包含的频点数w=N/l,其中fs为采样率,N为每帧的长度,k代表频点,k=0,1,2,3....N-1;计算帧信号的频谱平滑度γ(m,b)的计算公式如下:步骤S103、确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。本申请实施例中,可设置一啸叫阈值θ,当频谱平滑度的值大于该啸叫阈值θ时,可认定其满足预设条件,则对该帧信号进行增益处理。示例性的,该啸叫阈值的取值范围可以是0.1至0.3,具体可设置为0.15。本申请实施例中,在得到音频信号对应的频域下的帧信号后,对每一帧信号依据前述S102中的公式计算频谱平滑度,如果满足条件则直接对该帧信号进行增益处理,无需还原为时域信号再对时域信号进行处理,同时,增益处理过程针对每一帧单独设定,处理精准度高,通过上述的频谱平滑度计算公式以及后续和啸叫阈值进行比对以判定是否需要进行增益处理,算法复杂度叫现有技术而言显著降低。本申请实施例中,对所述帧信号进行增益处理包括:依据公式xmg(n)=gxm(n)对帧信号进行增益处理,其中,g为增益系数,取值范围包括0至0.5,xm(n)为音频信号对应的频域本文档来自技高网...

【技术保护点】
1.音频信号处理方法,其特征在于,包括:/n获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;/n计算所述帧信号的频谱平滑度;/n确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。/n

【技术特征摘要】
1.音频信号处理方法,其特征在于,包括:
获取音频信号,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号;
计算所述帧信号的频谱平滑度;
确定所述频谱平滑度是否满足预设条件,如果是,则对所述帧信号进行增益处理。


2.根据权利要求1所述的方法,其特征在于,对所述音频信号进行预处理得到和所述音频信号对应的频域下的帧信号包括:
对所述音频信号进行分帧处理,对处理结果进行加窗处理后进行傅里叶变换得到和所述音频信号对应的频域下的帧信号。


3.根据权利要求2所述的方法,其特征在于,对所述音频信号进行分帧处理,对处理结果进行加窗处理后进行傅里叶变换得到和所述音频信号对应的频域下的帧信号包括:
对音频信号x(n)进行分帧处理得到信号xm(n),其中n=0,1,2,3....N-1,m代表帧数为第m帧,N为每帧的长度;
依据公式对xm(n)进行加窗处理,其中,



对信号进行傅里叶变换得到频域下的帧信号X(m,k),其中,k代表频点,k=0,1,2,3....N-1。


4.根据权利要求3所述的方法,其特征在于,所述计算所述帧信号的频谱平滑度包括:
将所述帧信号X(m,k)划分为l个频带的信号Xb(m,k),其中b为第b个频带,b=0,1,2,3....l,每个频带的宽度为fs/l,每个频带包含的频点数w=N/l,其中fs为采样率;
依据公式计算信号Xb(m,k)的频谱平滑度γ(m,b),其中,bu为频带上频点,bl为频带下频点。

【专利技术属性】
技术研发人员:陈岩
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1