提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码制造技术

技术编号:8490395 阅读:135 留言:0更新日期:2013-03-28 13:18
音频编码器包括窗口函数控制器(504)、加窗器(502)、具有最终质量检查功能的时间扭曲器(506)、时间/频率转换器(508)、TNS级(510)或量化器编码器(512),由时间扭曲分析器(516)或信号分类器(520)获得的信号分析结果来控制所述窗口函数控制器(504)、所述时间扭曲器(506)、所述TNS级(510)或附加的噪声填充分析器(524)。此外,解码器使用取决于音频信号的谐波或语音特性的经操纵的噪声填充估计来应用噪声填充操作。

【技术实现步骤摘要】

本专利技术涉及音频编码和解码,并且具体地针对具有谐波或语音内容的、可受到时 间扭曲处理的音频信号的编码/解码。
技术介绍
在下文中,将给出对时间扭曲音频编码的领域的简要说明,该编码的概念可结合 本专利技术的一些实施例一起应用。近年来,技术上的发展可将音频信号变换为频域表示,并且例如考虑到感知屏蔽 阈值,可以对该频域表示进行有效地编码。如果发送编码频谱系数组的块长度很长,且如果 仅相当小数目的频谱系数远在该全局屏蔽阈值之上,同时很大数目的频谱系数在该全局屏 蔽阈值附近或之下并可能因而被忽略(或以最小码长进行编码)时,该音频信号编码的概 念特别有效。例如,基于余弦或基于正弦的调制的重叠变换通常由于它们的能量压缩性质而用 于源编码的应用。即,对于具有恒定基本频率(音调)的谐音而言,它们将信号能量浓缩于 小数目的频谱分量(子频带)中,这导致了有效的信号表示。大体而言,应当将信号的(基本)音调理解为可与该信号频谱相区别的最低主频 率。在普通语音模型中,该音调是由人类喉咙调制的激励信号的频率。如果仅一个单一基 本频率存在,该频谱将极其简单,仅包括该基本频率及泛音。可以高效地对这种频谱编码。 然而,对于具有变化音调的信号,对应于每个谐波分量的能量散布于若干变换系数上,因 而导致编码效率的减少。为了克服编码效率的减少,在不均匀时间网格上对要编码的音频信号有效地重新 采样。在随后的处理中,对通过不均匀重新采样所获得的采样位置就好像它们表示均匀时 间网格上的值一样进行处理。该操作一般由短语“时间扭曲”来表示。可取决于该音调的 时间变化来有利地选择采样时间,使得该音频信号的时间扭曲版本中的音调变化小于该音 频信号的原始版本(时间扭曲前)中的音调变化。该音调变化也可用短语“时间扭曲轮廓” 表示。在音频信号的时间扭曲之后,将该音频信号的时间扭曲版本转换为频域。该依赖于 音调的时间扭曲具有如下效果时间扭曲音频信号的频域表示一般地显示出将能量压缩成 远远小于该原始音频信号(未被时间扭曲)的频域表示的频谱分量数目。在解码器侧,将该时间扭曲音频信号的频域表示转换回时域,使得该时间扭曲音 频信号的时域表示在解码器侧可用。然而,在解码器侧重建时间扭曲音频信号的时域表示 中,不包括该编码器侧输入音频信号的原始音调变化。因此,通过对时间扭曲音频信号的解码器侧重建时域表示进行重新采样,来应用另一时间扭曲。为了在解码器处获得对编码 器侧输入音频信号的良好重建,需要解码器侧时间扭曲至少近似编码器侧时间扭曲的反操 作。为了获得恰当的时间扭曲,需要让允许调整解码器侧时间扭曲的信息在解码器处可用。因为一般要求将这种信息从音频信号编码器传输至音频信号解码器,需要将该发 送所需的比特率保持为小,同时仍允许在解码器侧可靠重建所需的时间扭曲信息。鉴于上述讨论,需要创建一种概念,其允许有效应用音频编码器中时间扭曲概念 的比特率。
技术实现思路
本专利技术的目的是创建以下概念基于在时间扭曲音频信号编码器或时间扭曲音频 信号解码器中可用的信息,来增强由编码音频信号所提供的听觉印象。由根据权利要求1所述的用于基于音频信号的表示来提供时间扭曲激活信号的 时间扭曲激活信号提供器、根据权利要求12所述的用于对输入音频信号编码的音频信号 编码器、根据权利要求14所述的用于提供时间扭曲激活信号的方法、根据权利要求15所述 的用于提供输入音频信号的编码表示的方法、或根据权利要求16所述的计算机程序来达 成该目的。本专利技术的另一目的是提供一种增强的音频编码/解码方案,该方案提供较高的质 量或较低的比特率。由根据权利要求17、26、32、37所述的音频编码器、根据权利要求20所述的音频解 码器、根据权利要求23、30、35或37所述的音频编码方法、根据权利要求24所述的解码方 法、或根据权利要求25、31、36或43所述的计算机程序来达成该目的。根据本专利技术的实施例与用于时间扭曲MDCT变换编码器的方法相关。一些实施例 仅与编码器工具相关。然而,其它实施例还与解码器工具相关。本专利技术的实施例创建时间扭曲激活信号提供器,其用于基于音频信号的表示来提 供时间扭曲激活信号。该时间扭曲激活信号提供器包括能量压缩信息提供器,被配置为提 供能量压缩信息,该信息描述音频信号的时间扭曲变换频谱表示中的能量压缩。该时间扭 曲激活信号提供器还包括比较器,该比较器被配置为将能量压缩信息与参考值相比较,且 取决于比较结果来提供时间扭曲激活信号。该实施例基于如下发现如果音频信号的时间扭曲变换频谱表示由于将能量浓缩 于一个或多个频谱区域(或频谱线)而包括充分压缩的能量分布,则从编码音频信号的比 特率减少的意义上来说,音频信号编码器中的时间扭曲功能性的使用一般带来增强。这是 由于如下的事实通过将模糊频谱(例如音频帧的模糊频谱)变换为具有一个或多个可辨 别波峰的频谱,且因此变换为具有比原始(未时间扭曲)音频信号的频谱更高的能量压缩 的频谱,则成功的时间扭曲带来减少比特率的效果。关于此问题,应理解音频信号帧(在该帧中音频信号的音调显著地变化)包括 模糊频谱。音频信号的时间变化音调具有如下效果在音频信号帧上执行的时域到频域的 变换导致信号能量在频域,具体地在较高频域,上的模糊分布。因此,这种原始(未时间扭 曲)音频信号的频谱表示包括低能量压缩,且一般在该频谱的较高频率部分不显示频谱波 峰,或仅在频谱中较高频率部分显示相对小的频谱波峰。相对地,如果时间扭曲成功(就提供该编码效率的增强而言),该原始音频信号的时间扭曲产生具有相对较高且清晰的波峰 的频谱(具体地在该频谱的较高频率部分中)的时间扭曲音频信号。这是由于以下事实 将具有时间变化音调的音频信号变换为具有较小音调变化或甚至近似恒定音调的时间扭 曲音频信号。因此,该时间扭曲音频信号的频谱表示(可以将其视为该音频信号的时间扭 曲变换频谱表示)包括一个或多个清晰频谱波峰。换言之,通过成功的时间扭曲操作来减 少该原始音频信号(具有在时间上变化的音调)频谱的模糊,使得该音频信号的时间扭曲 变换频谱表示包括比原始音频信号的频谱更高的能量压缩。然而,时间扭曲在增强编码效 率中并不总是成功。例如,如果输入音频信号包括大的噪声分量,或如果所提取的时间扭曲 轮廓不精确,则时间扭曲不增强编码效率。鉴于该情况,由能量压缩信息提供器提供的能量压缩信息就减少比特率而言是判 定该时间扭曲是否成功的有价值指示符。本专利技术的实施例创建时间扭曲激活信号提供器,用于基于音频信号的表示提供时 间扭曲激活信号。该时间扭曲激活提供器包括两个时间扭曲表示提供器,所述两个时间扭 曲标识提供器被配置为使用不同的时间扭曲轮廓信息来提供该相同音频信号的两个时间 扭曲表示。因此,该时间扭曲表示提供器可以用相同的方式配置(在结构上或功能上),且 使用相同音频信号但是不同的时间扭曲轮廓信息。该时间扭曲激活信号提供器还包括两个 能量压缩信息提供器,所述两个能量压缩信息提供器被配置为基于第一时间扭曲表示提供 第一能量压缩信息,且基于第二时间扭曲表示提供第二能量压缩信息。该能量压缩信息提 供器可以用相同方式配置,但是使用不同的时间扭曲表示。此外,该时间扭曲激活信号提供 器包括比较器,以将两个不同能量压缩信息进行比较,且提供取决于比较结果的时间本文档来自技高网
...

【技术保护点】
一种用于产生编码音频信号的音频编码器,包括:音频信号分析器(516、520),用于分析所述音频信号的时帧具有谐波还是语音特性;窗口函数控制器(504),用于取决于所述音频信号的谐波或语音特性来选择窗口函数;加窗器(502),用于使用所选择的窗口函数将所述音频信号窗口化,以获得窗口化帧;以及处理器(508、512),用于进一步处理所述窗口化帧,以获得所述编码音频信号;其中,所述窗口函数控制器(504)包括用于检测瞬变的瞬变检测器(700),所述窗口函数控制器被配置为用于当检测到瞬变且所述音频信号分析器(516、520)未发现谐波或语音特性时,从针对长块的窗口函数切换至针对短块的窗口函数,以及被配置为用于当检测到瞬变且所述音频信号分析器(516、520)发现谐波或语音特性时,不切换至针对短块的窗口函数;以及其中,所述窗口函数控制器(504)被配置为用于当检测到瞬变且所述信号具有谐波或语音特性时,切换至比针对短块的窗口函数更长的窗口函数(707),并且适于获得比针对长块的窗口函数(714)更短的与之前窗口(706)重叠的左侧重叠长度(712),使得适于获得更短的重叠长度的窗口函数(707)用于对语音开始或谐波信号的开始进行窗口化。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:斯特凡·拜尔萨沙·迪施拉尔夫·盖格尔纪尧姆·福克斯马克斯·诺伊恩多夫杰拉尔德·舒勒贝恩德·埃德勒
申请(专利权)人:弗劳恩霍夫应用研究促进协会
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1