使用频域处理器、时域处理器和用于连续初始化的交叉处理器的音频编码器和解码器制造技术

技术编号:15530024 阅读:135 留言:0更新日期:2017-06-04 17:14
一种用于对音频信号进行编码的音频编码器,包括:第一编码处理器(600),用于在频域中对第一音频信号部分进行编码,其中第一编码处理器(600)包括:时间频率转换器,用于将第一音频信号部分转换为具有一直到第一音频信号部分的最大频率的频谱线的频域表示;频谱编码器,用于对频域表示进行编码;第二编码处理器,用于在时域中对第二不同音频信号部分进行编码;交叉处理器(700),用于从第一音频信号部分的编码的频谱表示中计算第二编码处理器(610)的初始化数据,使得第二编码处理(610)被初始化以对音频信号中按时间紧随第一音频信号部分的第二音频信号部分进行编码;控制器,被配置为分析音频信号并且用于确定音频信号的哪个部分是在频域中编码的第一音频信号部分,以及音频信号的哪个部分是在时域中编码的第二音频信号部分;和编码信号形成器,用于形成编码的音频信号,所述编码的音频信号包括用于第一音频信号部分的第一编码信号部分和用于第二音频信号部分的第二编码信号部分。

Audio coder and decoder using frequency domain processor, time domain processor and cross processor for continuous initialization

An audio encoder for encoding the audio signal comprises a first encoding processor (600), for encoding the first audio signal in the frequency domain, wherein the first encoding processor (600) comprises a frequency converter for the first time, the audio signal has been partially converted to frequency spectrum to the maximum frequency first line part of the representation of the audio signal spectrum; encoder for encoding said frequency domain; second encoding processor used in time domain of second different parts of the audio signal encoding; cross processor (700), for the first part of the audio signal from the spectrum in the calculation of the second encoding encoding said processor (610) initialization the second data encoding processing (610) is initialized to follow the first audio signal part according to the time in the audio signal of second audio signal. No part of the encoding; controller configured to analyze audio signals and audio signals are used to determine which part is the first part of the audio signal encoding in the frequency domain, and the audio signal which part is the second part of the audio signal encoding in time domain; and encoding signal forming device, audio signal for encoding audio signal form. The encoding includes a first portion of the first audio signal encoding signal part and a second signal encoding second audio signal part.

【技术实现步骤摘要】
【国外来华专利技术】使用频域处理器、时域处理器和用于连续初始化的交叉处理器的音频编码器和解码器
本专利技术涉及音频信号编码和解码,并且特别地涉及使用并行频域和时域编码器/解码器处理器的音频信号处理。
技术介绍
为了用于音频信号的高效存储或传输的数据减少的目的,音频信号的感知编码是一种广泛使用的实践。特别地,当要实现最低比特率时,所采用的编码导致音频质量的降低,这通常主要由要发送的音频信号带宽的编码器侧的限制引起。这里,通常对音频信号进行低通滤波,使得没有频谱波形内容保留在某个预先确定的截止频率之上。在当代的编解码器中,存在用于通过音频信号带宽扩展(BWE)的解码器侧信号恢复的公知方法,例如,在频域中操作的频谱带复制(SBR)或所谓的时域带宽扩展(TD-BWE)是在时域中操作的语音编码器中的后处理器。另外,存在若干组合的时域/频域编码构思,例如在术语AMR-WB+或USAC下已知的构思。所有这些组合的时域/编码构思具有以下共同之处:频域编码器依赖于将频带限制引入输入音频信号中的带宽扩展技术,并且交叉频率或边界频率以上的部分用低分辨率编码构思编码并在解码器侧合成。因此,这些构思主要依赖于编码器侧的预处理器技术和解码器侧的相应后处理功能。通常,选择时域编码器用于在时域中编码的有用信号(例如语音信号),并且选择频域编码器用于非语音信号、音乐信号等。然而,特别是针对在高频带中具有突出谐波的非语音信号,现有技术的频域编码器具有降低的精度,并且因此具有降低的音频质量,这是由于以下事实:这样的突出谐波只能被分离地以参数方式编码,或者在编码/解码处理中完全被消除。此外,存在这样的构思,其中时域编码/解码分支另外依赖于也以参数方式对较高频率范围进行编码的带宽扩展,而较低频率范围通常使用ACELP或任何其它CELP相关编码器(例如语音编码器)进行编码。这种带宽扩展功能性增加了比特率效率,但是另一方面,由于两个编码分支,即频域编码分支和时域编码分支由于在基本上低于包括在输入音频信号中的最大频率的某个交叉频率以上进行操作的频谱带复制过程或带宽扩展过程而被频带限制的事实,引入了进一步的不灵活性。现有技术的相关主题包括-SBR作为用于波形解码的后处理器[1-3]-MPEG-DUSAC核心切换[4]-MPEG-H3DIGF[5]以下论文和专利描述了被认为构成本申请的现有技术的方法:[1]M.Dietz,L.Liljeryd,K.和O.Kunz,“SpectralBandReplication,anovelapproachinaudiocoding,”在第112届AES大会,慕尼黑,德国,2002。[2]S.Meltzer,R.和F.Henn,“SBRenhancedaudiocodecsfordigitalbroadcastingsuchas“DigitalRadioMondiale”(DRM),”在第112届AES大会,慕尼黑,德国,2002。[3]T.Ziegler,A.Ehret,P.Ekstrand和M.Lutzky,“Enhancingmp3withSBR:FeaturesandCapabilitiesofthenewmp3PROAlgorithm,”在第112届AES大会,慕尼黑,德国,2002。[4]MPEG-DUSAC标准。[5]PCT/EP2014/065109。在MPEG-DUSAC中,描述了一种可切换核心编码器。然而,在USAC中,带限核心被限制为总是发送低通滤波信号。因此,包含突出的高频内容的某些音乐信号例如全频带扫描、三角形声音等不能忠实地再现。
技术实现思路
本专利技术的目的是提供一种用于音频编码的改进的构思。该目的通过权利要求1的音频编码装置编码器、权利要求10的音频解码器、权利要求15的音频编码方法、权利要求16的音频解码方法或权利要求17的计算机程序来实现。本专利技术基于以下发现:时域编码/解码处理器可以与具有间隙填充功能的频域编码/解码处理器组合,但是用于填充频谱空洞的该间隙填充功能在音频信号的整个频带上或至少在某个间隙填充频率以上进行操作。重要的是,频域编码/解码处理器特别地能够以执行高达最大频率的精确或波形或频谱值编码/解码,而不仅是直到交叉频率为止。此外,用于以高分辨率编码的频域编码器的全频带能力允许将间隙填充功能集成到频域编码器中。在一个方面,全带隙填充与时域编码/解码处理器组合。在实施例中,两个分支中的采样率相等,或者时域编码器分支中的采样率低于频域分支中的采样率。在另一方面中,在没有间隙填充但执行全频带核心编码/解码的情况下操作的频域编码器/解码器与时域编码处理器组合,并且提供交叉处理器用于时域编码/解码处理器的连续初始化。在这方面,采样率可以如在另一方面中那样,或者频域分支中的采样率甚至低于时域分支中的采样率。因此,根据本专利技术,通过使用全频带频谱编码器/解码器处理器,一方面与带宽扩展的分离相关和另一方面与核心编码相关的问题可以通过执行在核心解码器操作的相同频谱域中的带宽扩展来解决和克服。因此,提供全速率核心解码器,其对全音频信号范围进行编码和解码。这不要求对在编码器侧上的下采样器和在解码器侧上的上采样器的需要。替代地,整个处理在全采样率或全带宽域中执行。为了获得高编码增益,分析音频信号以便找到必须以高分辨率编码的第一组第一频谱部分,其中该第一组第一频谱部分在一个实施例中可以包括:音频信号的音调部分。另一方面,构成第二组第二频谱部分的音频信号中的非音调或噪声分量被以低频谱分辨率以参数方式编码。编码的音频信号然后仅要求以具有高频谱分辨率的波形保持方式编码的第一组第一频谱部分,以及此外,以使用来源于第一组的频率“拼块(tile)”的低分辨率以参数方式编码的第二组第二频谱部分。在解码器侧,作为全频带解码器的核心解码器以波形保持方式重建第一组第一频谱部分,即,没有任何存在任何附加频率再生的知识。然而,如此产生的频谱具有许多频谱间隙。这些间隙随后通过一方面使用应用参数数据的频率再生和另一方面使用源频谱范围(即,由全速率音频解码器重建的第一频谱部分)而用智能间隙填充(IGF)技术填充。在另外的实施例中,通过仅噪声填充而不是带宽复制或频率拼块填充来重建的频谱部分构成第三组第三频谱部分。由于编码构思在用于一方面核心编码/解码和另一方面频率再生的单个域中操作的事实,通过在没有频率再生的情况下的噪声填充或通过使用在不同频率范围的频率拼块的频率再生,IGF不仅被限制为填满较高的频率范围,而且可以填满较低的频率范围。此外,要强调的是,关于频谱能量的信息,关于各个能量的信息或个别能量信息,关于存活能量的信息或存活能量信息,关于拼块能量的信息或拼块能量信息,或者关于缺失能量的信息或缺失能量信息可以不仅包括能量值,而且还包括(例如绝对的)振幅值、电平值或任何其他值,从中可以导出最终能量值。因此,关于能量的信息可以例如包括能量值本身,和/或电平的和/或振幅的和/或绝对振幅的值。另外的方面基于以下发现:相关情况不仅对于源范围重要,而且对于目标范围也重要。此外,本专利技术承认在源范围和目标范围中可能发生不同相关情况的情况。例如,当考虑具有高频噪声的语音信号时,情况可能是当扬声器放置在中间时包括具有小数量的泛音的语音信号的低频带在左声道和右声道中高本文档来自技高网
...
使用频域处理器、时域处理器和用于连续初始化的交叉处理器的音频编码器和解码器

【技术保护点】
一种用于对音频信号进行编码的音频编码器,包括:第一编码处理器(600),用于在频域中对第一音频信号部分进行编码,其中第一编码处理器(600)包括:时间频率转换器(602),用于将第一音频信号部分转换为具有一直到第一音频信号部分的最大频率的频谱线的频域表示;频谱编码器(606),用于对频域表示进行编码;第二编码处理器(610),用于在时域中对不同的第二音频信号部分进行编码;交叉处理器(700),用于从第一音频信号部分的编码的频谱表示中计算第二编码处理器(610)的初始化数据,使得第二编码处理(610)被初始化以对音频信号中在时间上紧随第一音频信号部分的第二音频信号部分进行编码;控制器(620),被配置用于分析音频信号,并且用于确定音频信号的哪个部分是在频域中编码的第一音频信号部分,以及音频信号的哪个部分是在时域中编码的第二音频信号部分;以及编码信号形成器(630),用于形成编码的音频信号,所述编码的音频信号包括用于第一音频信号部分的第一编码信号部分和用于第二音频信号部分的第二编码信号部分。

【技术特征摘要】
【国外来华专利技术】2014.07.28 EP 14178819.01.一种用于对音频信号进行编码的音频编码器,包括:第一编码处理器(600),用于在频域中对第一音频信号部分进行编码,其中第一编码处理器(600)包括:时间频率转换器(602),用于将第一音频信号部分转换为具有一直到第一音频信号部分的最大频率的频谱线的频域表示;频谱编码器(606),用于对频域表示进行编码;第二编码处理器(610),用于在时域中对不同的第二音频信号部分进行编码;交叉处理器(700),用于从第一音频信号部分的编码的频谱表示中计算第二编码处理器(610)的初始化数据,使得第二编码处理(610)被初始化以对音频信号中在时间上紧随第一音频信号部分的第二音频信号部分进行编码;控制器(620),被配置用于分析音频信号,并且用于确定音频信号的哪个部分是在频域中编码的第一音频信号部分,以及音频信号的哪个部分是在时域中编码的第二音频信号部分;以及编码信号形成器(630),用于形成编码的音频信号,所述编码的音频信号包括用于第一音频信号部分的第一编码信号部分和用于第二音频信号部分的第二编码信号部分。2.根据权利要求1所述的音频编码器,其中,输入信号具有高频带和低频带,其中,第二编码处理器(610)包括:采样率转换器(900),用于将第二音频信号部分转换为较低采样率表示,较低采样率低于音频信号的采样率,其中较低采样率表示不包括输入信号的高频带;时域低频带编码器(910),用于对较低采样率表示进行时域编码;以及时域带宽扩展编码器(920),用于以参数方式对高频带进行编码。3.根据权利要求1或2所述的音频编码器,还包括:预处理器(1000),被配置用于预处理第一音频信号部分和第二音频信号部分,其中预处理器包括用于确定预测系数的预测分析器(1002);其中编码信号形成器(630)被配置用于将预测系数的经编码版本引入到编码的音频信号中。4.根据权利要求1、2或3所述的音频编码器,其中预处理器(1000)包括用于将音频信号重新采样到第二编码处理器的采样率的重新采样器(1004);以及其中预测分析器被配置为使用重新采样的音频信号来确定预测系数,或者其中预处理器(1000)还包括用于确定针对第一音频信号部分的一个或多个长期预测参数的长期预测分析级(1006)。5.根据前述权利要求之一所述的音频编码器,其中,所述交叉处理器(700)包括:频谱解码器(701),用于计算第一编码信号部分的经解码版本;延迟级(707),用于将经解码版本的延迟版本馈送到第二编码处理器的去加重级(617)中以进行初始化;加权预测系数分析滤波块(708),用于将滤波器输出馈送到第二编码处理器(610)的码本确定器(613)中以进行初始化;分析滤波级(706),用于对经解码版本或预加重(709)版本进行滤波,并且用于将滤波残留馈送到第二编码处理器的自适应码本确定器(612)中以进行初始化;或者预加重滤波器(709),用于对经解码版本进行滤波,并且用于将延迟或预加重版本馈送到第二编码处理器(610)的合成滤波级(616)以进行初始化。6.根据前述权利要求之一所述的音频编码器,其中第一编码处理器(600)被配置为使用从第一音频信号部分导出的预测系数(1002、1010)执行频域表示的频谱值的整形(606a),并且其中第一编码处理器(600)还被配置为执行第一频谱区域的整形后的频谱值的量化和熵编码操作(606b)。7.根据前述权利要求中任一项所述的音频编码器,其中,交叉处理器(700)包括:噪声整形器(703),用于使用从第一音频信号部分导出的LPC系数(1010)对频域表示的量化频谱值进行整形;频谱解码器(704、705),用于以高频谱分辨率对频域表示的频谱整形的频谱部分进行解码,以获得解码的频谱表示;频率-时间转换器(702),用于将频谱表示转换到时域中以获得解码的第一音频信号部分,其中与解码的第一音频信号部分相关联的采样率不同于音频信号的采样率,以及与频率-时间转换器(702)的输出信号相关联的采样率不同于与输入到频率-时间转换器(602)中的音频信号相关联的采样率。8.根据前述权利要求之一所述的音频编码器,其中第二编码处理器包括以下块组中的至少一个块:预测分析滤波器(611);自适应码本级(612);创新码本级(614);估计器(613),用于估计创新码本条目;ACELP/增益编码级(615);预测合成滤波级(616);去加重级(617);和低音后滤波分析级(618)。9.根据前述权利要求之一所述的音频编码器,其中时域编码处理器具有相关联的第二采样率,其中频域编码处理器具有与其相关联的不同于第二采样率的第一采样率,其中交叉处理器包括用于以第二采样率产生时域信号的频率-时间转换器(702),其中频率时间转换器(702)包括:选择器(726),用于根据第一采样率和第二采样率之比选择输入到频率时间转换器中的频谱的一部分,变换处理器(720),具有与时间-频率转换器(602)的变换长度不同的变换长度;以及合成加窗器(712),用于使用与由时间频率转换器(602)使用的窗口相比具有不同数量的窗口系数的窗口进行窗口化。10.一种音频解码器,用于对编码的音频信号进行解码,包括:第一解码处理器(1120),用于在频域中对第一编码音频信号部分进行解码,第一解码处理器(1120)包括频率-时间转换器(1120),用于将解码的频谱表示转换到时域中,以获得解码的第一音频信号部分;第二解码处理器(1140),用于在时域中对第二编码的音频信号部分进行解码以获得解码的第二音频信号部分;交叉处理器(1170),用于从第一编码音频信号部分的解码的频谱表示中计算第二解码处理器(1140)的初始化数据,使得第二解码处理器(1140)被初始化以对...

【专利技术属性】
技术研发人员:萨沙·迪施马丁·迪茨马库斯·马特拉斯吉洛姆·福赫斯埃曼努尔·拉维利马蒂亚斯·诺伊辛格马库斯·施内尔本杰明·舒伯特伯恩哈德·格瑞
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:德国,DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1