使用线性预测编码以使背景噪声减小的方式对音频信号进行编码的编码器和方法技术

技术编号:18580909 阅读:28 留言:0更新日期:2018-08-01 14:53
示出了用于使用线性预测编码以使背景噪声减小的方式对音频信号进行编码的编码器。该编码器包括:背景噪声估计器,被配置为估计音频信号的背景噪声;背景噪声减小器,被配置为通过从音频信号中减去所估计出的音频信号的背景噪声,来产生背景噪声减小的音频信号;以及预测器,被配置使音频信号经受线性预测分析,以获得第一组线性预测滤波器(LPC)系数,并且使背景噪声减小的音频信号经受线性预测分析,以获得第二组线性预测滤波器(LPC)系数。此外,该编码器包括分析滤波器,分析滤波器包括通过所获得的第一组LPC系数和所获得的第二组LPC系数来进行控制的级联的时域滤波器。

Encoders and methods for encoding audio signals using linear predictive coding to reduce background noise

An encoder for encoding audio signals in a manner that uses linear predictive coding to reduce background noise is shown. The encoder includes the background noise estimator configured to estimate the background noise of the audio signal; the background noise reduction device is configured to generate audio signals with reduced background noise by subtracting the background noise from the audio signal from the audio signal; and the predictor is configured to withstand the audio signal. Linear prediction analysis is used to obtain the first group of linear predictive filter (LPC) coefficients, and the audio signals with reduced background noise are subjected to linear prediction analysis to obtain second sets of linear predictive filter (LPC) coefficients. In addition, the encoder includes an analysis filter, which includes a cascaded time domain filter controlled by the obtained first group of LPC coefficients and the obtained second sets of LPC coefficients.

【技术实现步骤摘要】
【国外来华专利技术】使用线性预测编码以使背景噪声减小的方式对音频信号进行编码的编码器和方法
本专利技术涉及一种使用线性预测编码以使背景噪声减小的方式对音频信号进行编码的编码器、对应的方法和包括编码器和解码器的系统。换句话说,本专利技术涉及联合语音增强和/或编码方法,例如通过并入CELP(码本激励线性预测)编解码器中来对语音进行联合增强和编码。
技术介绍
随着语音和通信设备变得普遍存在,并且可能在不利条件下使用,对于能够应对不利环境的语音增强方法的需求得以增加。因此,例如,在移动电话中,现在通常将噪声衰减方法用作对于所有后续语音处理(例如,语音编码)的预处理块/步骤。存在将语音增强并入到语音编码器中的各种方法[1,2,3,4]。尽管这样的设计确实提高了发送的语音质量,但是级联处理不允许质量的联合感知优化/最小化,或者量化噪声和干扰的联合最小化至少是困难的。语音编解码器的目标是允许用最少量的发送数据来发送高质量的语音。为了实现这个目标,需要信号的有效表示,例如通过线性预测对语音信号的频谱包络进行建模,通过长时预测器对基频进行建模,以及利用噪声码本对剩余部分进行建模。这种表示是语音编解码器使用编码激励线性预测(CELP)范式的基础,CELP范式用于主要语音编码标准中(例如,自适应多速率(AMR)、AMR-宽带(AMR-WB)、统一语音和音频编码(USAC)和增强语音服务(EVS)[5,6,7,8,9,10,11])。对于自然语音通信,说话者经常在免提模式下使用设备。在这种情况下,麦克风通常远离嘴巴,由此语音信号很容易因干扰(比如,混响或背景噪声)而失真。劣化不仅影响感知的语音质量,还影响语音信号的可理解性,因此会严重妨碍对话的自然性。为了改善通信体验,应用语音增强方法来衰减噪声并减少混响的影响是有益的。语音增强领域是成熟的,并且有很多方法可用[12]。然而,大多数现有算法基于应用了基于重叠相加的开窗方案的重叠相加方法(例如,诸如短时傅立叶变换(STFT)之类的变换),而相反地,CELP编解码器利用线性预测器/线性预测滤波器来对信号进行建模,并且仅对残差应用开窗。这些基本差异使得混合增强和编码方法变得困难。但很明显,增强和编码的联合优化可以提高质量,减小延迟和计算复杂度。因此,需要一种改进的方法。
技术实现思路
本专利技术的目的是提供一种用于使用线性预测编码来处理音频信号的改善型构思。该目的通过独立权利要求的主题来解决。本专利技术的实施例示出了一种编码器,用于使用线性预测编码以使背景噪声减小的方式对音频信号进行编码。该编码器包括:背景噪声估计器,被配置为估计音频信号的背景噪声;背景噪声减小器,被配置为通过从音频信号中减去所估计出的音频信号的背景噪声,来产生背景噪声减小的音频信号;以及预测器,被配置使音频信号经受线性预测分析,以获得第一组线性预测滤波器(LPC)系数,并且使背景噪声减小的音频信号经受线性预测分析,以获得第二组线性预测滤波器(LPC)系数。此外,该编码器包括分析滤波器,分析滤波器包括通过所获得的第一组LPC系数和所获得的第二组LPC系数来进行控制的级联的时域滤波器。本专利技术基于以下发现:在线性预测编码环境中改进的分析滤波器提高了编码器的信号处理属性。更具体地,如果将级联的或一系列的串联连接的时域滤波器应用于线性预测编码环境的分析滤波器,则使用所述滤波器改善了输入音频信号的处理速度或处理时间。这是有利的,因为省略了通常使用的对入站时域音频信号的时频转换和逆频时转换以通过对主要受噪声影响的频段进行滤波来减小背景噪声。换句话说,通过执行背景噪声减小或消除来作为分析滤波器的一部分,可以在时域中执行背景噪声减小。因此,省略了可以用于时间/频率/时间转换的例如MDCT/IDMCT([逆]修改的离散余弦变换)的重叠相加过程。这种重叠相加方法限制了编码器的实时处理特性,这是因为背景噪声减少不能在单个帧上执行,而只能在连续帧上执行。换句话说,所描述的编码器能够在单个音频帧上执行背景噪声减少并因此执行分析滤波器的整个处理,因此能够实时处理音频信号。实时处理可以表示在没有参与用户可察觉到的延迟的情况下对音频信号的处理。例如,在电话会议中,如果一个用户必须等待另一个用户的响应,则由于音频信号的处理延迟,会出现可以察觉到的延迟。该最大允许延迟可以小于1秒,优选小于0.75秒,甚至更优选小于0.25秒。必须注意的是,这些处理时间表示音频信号从发送方到接收方的整个处理,因此除编码器的信号处理外,还包括发送音频信号的时间和对应解码器中的信号处理。根据实施例,级联的时域滤波器(也就是分析滤波器)包括两次使用所获得的第一组LPC系数的线性预测滤波器和一次使用所获得的第二组LPC系数的另一线性预测滤波器的逆。该信号处理可以被成为维纳滤波。因此,换句话说,级联的时域滤波器可以包括维纳滤波器。根据其它实施例,背景噪声估计器可以估计背景噪声的自相关,来作为音频信号的背景噪声的表示。此外,背景噪声减小器可以通过从所估计出的音频信号的自相关中减去背景噪声的自相关来产生背景噪声减小的音频信号的表示,其中所估计出的音频信号的自相关是音频信号的表示,并且其中背景噪声减小的音频信号的表示是背景噪声减小的音频信号的自相关。使用自相关函数的估计而不是使用时域音频信号来计算LPC系数并执行背景噪声减小使得能够完全在时域中进行信号处理。因此,可以通过卷积或通过使用音频帧或音频帧的子部分的卷积积分来计算音频信号的自相关和背景噪声的自相关。因此,可以在帧中或者甚至仅在子帧中执行背景噪声的自相关,所述帧或子帧可以被定义为其中(几乎)不存在前景音频信号(比如,语音)的帧或帧的一部分。此外,可以通过使音频信号(包括背景噪声)的自相关和背景噪声的自相关相减来计算背景噪声减小的音频信号的自相关。使用背景噪声减小的音频信号和音频信号(通常具有背景噪声)的自相关能够分别计算针对背景噪声减小的音频信号的LPC系数和针对音频信号的LPC系数。背景噪声减小的LPC系数可以被称为第二组LPC系数,其中音频信号的LPC系数可以被称为第一组LPC系数。由于级联的时域滤波器的应用也在时域中对音频信号执行滤波,因此,可以完全在时域中处理音频信号。在使用附图详细描述实施例之前,需要指出的是,在附图中,相同或功能等同的元件被赋予相同的附图标记,并且省略了对具有相同附图标记的元件的重复描述。因此,针对具有相同附图标记的元件而提供的描述可相互交换。附图说明随后将参考附图讨论本专利技术的实施例,在附图中:图1示出了包括用于对音频信号进行编码的编码器和解码器在内的系统的示意性框图;图2示出了如下项的示意性框图:a)级联增强编码方案,b)CELP语音编码方案,以及c)本专利技术的联合增强编码方案;图3示出了具有不同标记的图2的实施例的示意性框图;图4示出了针对所提出的联合方法(J)和级联方法(C)在等式23中定义的感知大小SNR(信噪比)的示意性线形图,其中输入信号是由非平稳汽车噪声劣化的,并且针对两种不同的比特率(由下标7指示的7.2kbit/s和由下标13指示的13.2kbit/s)呈现了结果;图5示出了针对所提出的联合方法(J)和级联方法(C)在等式23中定义的感知大小SNR的示意性线形图,其中输入信号是由平稳白噪声劣化的,并且针对两种本文档来自技高网
...

【技术保护点】
1.一种编码器(4),用于使用线性预测编码以使背景噪声减小的方式对音频信号(8’)进行编码,所述编码器(4)包括:背景噪声估计器(10),被配置为估计所述音频信号(8’)的背景噪声的表示(12);背景噪声减小器(14),被配置为通过从所述音频信号的表示(8)中减去所估计出的所述音频信号(8’)的背景噪声的表示(12),来产生背景噪声减小的音频信号的表示(16);预测器(18),被配置为:使所述音频信号的表示(8)经受线性预测分析,以获得第一组线性预测滤波器“LPC”系数(20a),以及使所述背景噪声减小的音频信号的表示(12)经受线性预测分析,以获得第二组线性预测滤波器“LPC”系数(20b);以及分析滤波器(22),包括通过所获得的第一组LPC系数(20a)和所获得的第二组LPC系数(20b)进行控制的级联的时域滤波器(24,24a,24b),以根据所述音频信号(8’)获得残差信号(26)。

【技术特征摘要】
【国外来华专利技术】2015.09.25 EP 15186901.3;2016.06.21 EP 16175469.21.一种编码器(4),用于使用线性预测编码以使背景噪声减小的方式对音频信号(8’)进行编码,所述编码器(4)包括:背景噪声估计器(10),被配置为估计所述音频信号(8’)的背景噪声的表示(12);背景噪声减小器(14),被配置为通过从所述音频信号的表示(8)中减去所估计出的所述音频信号(8’)的背景噪声的表示(12),来产生背景噪声减小的音频信号的表示(16);预测器(18),被配置为:使所述音频信号的表示(8)经受线性预测分析,以获得第一组线性预测滤波器“LPC”系数(20a),以及使所述背景噪声减小的音频信号的表示(12)经受线性预测分析,以获得第二组线性预测滤波器“LPC”系数(20b);以及分析滤波器(22),包括通过所获得的第一组LPC系数(20a)和所获得的第二组LPC系数(20b)进行控制的级联的时域滤波器(24,24a,24b),以根据所述音频信号(8’)获得残差信号(26)。2.根据权利要求1所述的编码器(4),其中,所述级联的时域滤波器(24)包括两次使用所获得的第一组LPC系数(20a)的线性预测滤波器(24a)以及一次使用所获得的第二组LPC系数(20b)的另一线性预测滤波器(24b)的逆。3.根据前述权利要求中任一项所述的编码器(4),其中,所述级联的时域滤波器(24)是维纳滤波器。4.根据前述权利要求中任一项所述的编码器(4),其中,所述背景噪声估计器(10)被配置为估计所述背景噪声的自相关,作为所述音频信号(8)的背景噪声的表示(12);其中,所述背景噪声减小器(14)被配置为:通过从所述音频信号的自相关(8)中减去所述背景噪声的自相关(12)来产生所述背景噪声减小的音频信号...

【专利技术属性】
技术研发人员:尤纳斯·弗斯彻汤姆·巴克斯特伦埃马·约金内
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1