音频信号增强方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:31230044 阅读:9 留言:0更新日期:2021-12-08 10:00
本申请涉及一种音频信号增强方法、装置、计算机设备和存储介质。所述方法包括:当接收到语音包时,对所述语音包依序进行解码和滤波,得到音频信号;当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;基于解码所述语音包所得的线性滤波参数,将所述音频信号转换为滤波器语音激励信号;根据所述特征参数以及解码所述语音包所得的长时滤波参数和线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;基于所述增强后语音激励信号和所述线性滤波参数进行语音合成,得到语音增强信号。采用本方法能够提高音频信号增强的时效性。本方法能够提高音频信号增强的时效性。本方法能够提高音频信号增强的时效性。

【技术实现步骤摘要】
音频信号增强方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种音频信号增强方法、装置、计算机设备和存储介质。

技术介绍

[0002]音频信号在编解码的过程中通常会引入量化噪声,使得解码合成出的语音出现失真。传统方案中通常采用基音滤波(Pitch Filter)或基于神经网络(Neural Network)的后处理技术来增强音频信号,以减少量化噪声对语音质量的影响。
[0003]然而,传统方案信号处理的速度较低,存在较大的时延,并且所能达到的语音质量的提升效果是有限的,导致对音频信号增强的时效性较差。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高音频信号增强的时效性的音频信号增强方法、装置、计算机设备和存储介质。
[0005]一种音频信号增强方法,所述方法包括:
[0006]对接收到的语音包依序进行解码,得到残差信号、长时滤波参数和线性滤波参数;对所述残差信号进行滤波,得到音频信号;
[0007]当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;
[0008]基于所述线性滤波参数,将所述音频信号转换为滤波器语音激励信号;
[0009]根据所述特征参数、所述长时滤波参数和所述线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;
[0010]基于所述增强后语音激励信号和所述线性滤波参数进行语音合成,得到语音增强信号。
[0011]在一个实施例中,所述线性滤波参数包括线性滤波系数和能量增益值;所述基于所述线性滤波参数对线性预测滤波器进行参数配置,通过参数配置后的线性预测滤波器对所述增强后语音激励信号进行线性合成滤波,包括:
[0012]基于所述线性滤波系数对线性预测滤波器进行参数配置;
[0013]获取在解码所述语音包之前所解码的历史语音包对应的能量增益值;
[0014]基于所述历史语音包对应的能量增益值和所述语音包对应的能量增益值,确定能量调整参数;
[0015]通过所述能量调整参数对所述历史语音包对应的历史长时滤波激励信号进行能量调整,得到调整后历史长时滤波激励信号;
[0016]将所述调整后历史长时滤波激励信号和所述增强后语音激励信号输入至参数配置后的线性预测滤波器,以使所述线性预测滤波器基于所述调整后历史长时滤波激励信号,对所述增强后语音激励信号进行线性合成滤波。
[0017]一种音频信号增强装置,所述装置包括:
[0018]语音包处理模块,用于对接收到的语音包依序进行解码,得到残差信号、长时滤波参数和线性滤波参数;对所述残差信号进行滤波,得到音频信号;
[0019]特征参数提取模块,用于当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;
[0020]信号转换模块,用于基于所述线性滤波参数,将所述音频信号转换为滤波器语音激励信号;
[0021]语音增强模块,用于根据所述特征参数、所述长时滤波参数和所述线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;
[0022]语音合成模块,用于基于所述增强后语音激励信号和所述线性滤波参数进行语音合成,得到语音增强信号。
[0023]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0024]对接收到的语音包依序进行解码,得到残差信号、长时滤波参数和线性滤波参数;对所述残差信号进行滤波,得到音频信号;
[0025]当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;
[0026]基于所述线性滤波参数,将所述音频信号转换为滤波器语音激励信号;
[0027]根据所述特征参数、所述长时滤波参数和所述线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;
[0028]基于所述增强后语音激励信号和所述线性滤波参数进行语音合成,得到语音增强信号。
[0029]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0030]对接收到的语音包依序进行解码,得到残差信号、长时滤波参数和线性滤波参数;对所述残差信号进行滤波,得到音频信号;
[0031]当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;
[0032]基于所述线性滤波参数,将所述音频信号转换为滤波器语音激励信号;
[0033]根据所述特征参数、所述长时滤波参数和所述线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;
[0034]基于所述增强后语音激励信号和所述线性滤波参数进行语音合成,得到语音增强信号。
[0035]一种计算机程序,所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行以下步骤:
[0036]对接收到的语音包依序进行解码,得到残差信号、长时滤波参数和线性滤波参数;对所述残差信号进行滤波,得到音频信号;
[0037]当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;
[0038]基于所述线性滤波参数,将所述音频信号转换为滤波器语音激励信号;
[0039]根据所述特征参数、所述长时滤波参数和所述线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;
[0040]基于所述增强后语音激励信号和所述线性滤波参数进行语音合成,得到语音增强信号。
[0041]上述音频信号增强方法、装置、计算机设备和存储介质,通过对接收到语音包依序进行解码得到残差信号、长时滤波参数和线性滤波参数,并对残差信号进行滤波,得到音频信号,并在音频信号为前向纠错帧信号时,从音频信号中提取特征参数,基于解码语音包所得的线性滤波系数,将音频信号转换为滤波器语音激励信号,从而根据特征参数以及解码语音包所得的长时滤波参数和线性滤波参数,对滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号,基于增强后语音激励信号和线性滤波参数进行语音合成,得到语音增强信号,从而在较少的时间内完成实现对音频信号的增强处理,且能达到较好的信号增强效果,提高了音频信号增强的时效性。
附图说明
[0042]图1为一个实施例中基于激励信号的语音生成模型示意图;
[0043]图2为一个实施例中音频信号增强方法的应用环境图;
[0044]图3为一个实施例中音频信号增强方法的流程示意图;
[0045]图4为一个实施例中音频信号传输流程示意图;
[0046]图5为一个实施例中长时预测滤波器的幅频响应图;
[0047]图6为一个实施例中语音包解码滤波步骤的流程示意图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种音频信号增强方法,其特征在于,所述方法包括:对接收到的语音包依序进行解码,得到残差信号、长时滤波参数和线性滤波参数;对所述残差信号进行滤波,得到音频信号;当所述音频信号为前向纠错帧信号时,从所述音频信号中提取特征参数;基于所述线性滤波参数,将所述音频信号转换为滤波器语音激励信号;根据所述特征参数、所述长时滤波参数和所述线性滤波参数,对所述滤波器语音激励信号进行语音增强处理,得到增强后语音激励信号;基于所述增强后语音激励信号和所述线性滤波参数进行语音合成,得到语音增强信号。2.根据权利要求1所述的方法,其特征在于,所述对所述残差信号进行滤波,得到音频信号,包括:基于所述长时滤波参数对长时预测滤波器进行参数配置,通过参数配置后的长时预测滤波器对所述残差信号进行长时合成滤波,得到长时滤波激励信号;基于所述线性滤波参数对线性预测滤波器进行参数配置,通过参数配置后的线性预测滤波器对所述长时滤波激励信号进行线性合成滤波,得到音频信号。3.根据权利要求2所述的方法,其特征在于,所述基于所述线性滤波参数对线性预测滤波器进行参数配置,通过参数配置后的线性预测滤波器对所述长时滤波激励信号进行线性合成滤波,得到音频信号,包括:将所述长时滤波激励信号分为至少两个子帧,得到子长时滤波激励信号;对所述线性滤波参数进行分组,得到至少两个线性滤波参数集合;基于所述线性滤波参数集合分别对至少两个线性预测滤波器进行参数配置;将所得的子长时滤波激励信号分别输入参数配置后的线性预测滤波器,以使所述线性预测滤波器基于所述线性滤波参数集合对所述子长时滤波激励信号进行线性合成滤波,得到与各子帧对应的子音频信号;按照各所述子帧的时序对所述子音频信号进行组合,得到音频信号。4.根据权利要求3所述的方法,其特征在于,所述线性滤波参数包括线性滤波系数和能量增益值;所述方法还包括:针对所述长时滤波激励信号中的第一子帧对应的子长时滤波激励信号,获取历史长时滤波激励信号中与所述第一子帧对应的子长时滤波激励信号相邻的子帧的历史子长时滤波激励信号的能量增益值;基于所述历史子长时滤波激励信号对应的能量增益值和所述第一子帧对应的子长时滤波激励信号的能量增益值,确定所述子长时滤波激励信号对应的能量调整参数;通过所述能量调整参数对所述历史子长时滤波激励信号进行能量调整;所述将所得的子长时滤波激励信号分别输入参数配置后的线性预测滤波器,以使所述线性预测滤波器基于所述线性滤波参数集合对所述子长时滤波激励信号进行线性合成滤波,得到与各子帧对应的子音频信号,包括:将所得的子长时滤波激励信号和能量调整后所得的历史子长时滤波激励信号输入至参数配置后的线性预测滤波器,以使所述线性预测滤波器基于所述线性滤波系数和所述能量调整后所得的历史子长时滤波激励信号,对所述第一子帧对应的子长时滤波激励信号进
行线性合成滤波,得到第一子帧对应的子音频信号。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定在解码所述语音包之前所解码的历史语音包是否出现数据异常;若所述历史语音包出现数据异常时,则确定经过解码和滤波所得的所述音频信号为前向纠错帧信号。6.根据权利要求1所述的方法,其特征在于,所述特征参数包括倒谱特征参数;所述从所述音频信号中提取特征参数,包括:对所述音频信号进行傅里叶变换,得到傅里叶变换后的音频信号;将所述傅里叶变换后的音频信号进行对数处理,得到对数结果;对所述对数结果进行傅里叶逆变换,得到倒谱特征参数。7.根据权利要求6所述的方法,其特征在于,所述长时滤波参数包括基音周期和幅度增益值;所述根据...

【专利技术属性】
技术研发人员:王蒙黄庆博肖玮
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1