用于对音频信号进行代码转换的方法和设备技术

技术编号:5442006 阅读:227 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种用于在例如由MPEG-AAC和mp3使用的具有不同时间-频率分解域的音频编码格式间进行代码转换的方法和设备,特别用于在这样的音频信号间方便地、更快速地进行代码转换。一种用于将成帧后的音频信号从第一参数域(PDA)代码转换至第二参数域(PDB)的方法包括:将第一参数域(PDA)的两个或更多个参数线性变换(TT)为第二参数域(PDB)的至少一个参数,其中,第一参数域的所述两个或更多个参数来自第一参数域中的音频信号的不同帧。所述线性变换(TT)可以被描述为矩阵并实现为查找表。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于对音频信号进行代码转换的方法和设备。本 专利技术涉及音频压缩领域,更具体地,涉及不同的感知音频编码格式间 的代码转换的领域。然而,有利地,还可以在其他音频处理应用中使 用本专利技术的基本概念。
技术介绍
术语音频代码转换通常表示从另一比特流中导出比特流,该 比特流表示根据特定音频编码格式的音频信号,该另一比特流是根据 不同的音频编码格式组织而成的。在这种意义上,代码转换表示从遵循MPEG 1层III (mp3)的比特流获得例如遵循MPEG AAC的比 特流的整个过程。然而,在本文献中,在更为技术性的意义上使用术语音频代码 转换,来描述音频信号从一个子带或变换域至另一个的转换。这就是 说,该术语仅描述从一种表示至另一种表示转换中的一个主要步骤, 而不是描述整个过程。图1示出了从文献T. Painter and A. Spanias (2000): Perceptual Coding of Digital Audio, /V歸W, o/ 皿E, vol. 88中已知的一 般感知音频编码的基本原理。现今的音频信号压縮方法和格式一般使用时间-频率分解102 (即 滤波器组或变换)来表示音频信号107的参数110。对这些参数进行 量化和编码104、熵编码105以及比特流操作106;所有这些步骤都由 输入音频信号的心理声学分析101控制。图2示出了相应的一般的感 知音频解码器,其中有比特流操作201、熵解码202、比特分配203、 解码和解量化204以及最终的时间-频率合成,该时间-频率合成根据 参数212、 213来产生时域信号214。图1和图2示出并举例说明了感知音频编解码器的基本原理。然 而,尽管特定实施方式可能在一定程度上有所不同,但它们通常采用 时间-频率分解以及与其相反的时间-频率合成。现在集中讨论时间-频率分解和合成,不会进一步考虑中间的编码 和解码步骤。对于时间-频率分解102,在现今的音频编解码器中使用许多不同算法。例如,MPEG音频编解码器标准包括MPEG-1层I和II编解 码器(使用32频带伪QMF(正交镜像滤波器)滤波器组);以及MPEG-1 层III (mp3)(采用混合滤波器组,即32频带伪QMF滤波器组级联 后接MDCT (修正DCT)滤波器组)。MDCT滤波(默认为18箱(bin), 对于瞬变信号(transient)减少至6箱)分别导致576或192箱的频谱 分辨率。MPEGAAC编解码器及其衍生编解码器使用具有1024箱(对 于瞬变信号减少至256箱)默认分辨率的全频带MDCT方式。音频帧 经常在一定程度上(例如50%)时间重叠,这定义了所谓的帧前移 (frame advance): (100%-重叠部分)*帧的大小。结果,时间-频率分 解102的输出与时间-频率合成205的输入之间的域(其中编码器的输 出信号116输入206至解码器)将表示为频域或参数域,而不 管特定音频编码格式是使用滤波器组还是块变换来进行时间-频率分 解。由于现有的和新兴的音频格式不断涌现,对用于将音频内容从一 个比特流格式代码转换成另一个比特流格式的算法的需求随之增长。 图3示出了现今典型地使用的音频代码转换方式,这种方式被典型地 使用是由于其仅涉及图1和图2已描述的可用的标准模块。将以源格 式编码的输入比特流解码DEC—A为连续的时域PCM信号TD。然后, 独立的编码器ENC—B根据目标格式产生新的比特流。信号处理模块 间仅有的接口是从解码器传递到编码器的时域音频信号TD。尽管该方式使用简单,但会出现以下问题。第一,由于两个模块 DEC—A、 ENC—B并不知道对方,因此时间-频率分解过程可能会失去 同步通常, 一系列解码(解量化)和编码(量化)操作导致信号质 量恶化,即所谓的串联差错。第二,该方式的计算复杂度较高,因此需要显著地降低计算复杂度。如果由解码器提取且由编码器重用了源格式和目标格式在某种程度上共同的一些辅助信息,则可以获得更好的代码转换结果。图4a) 示出了该方式的示例,例如该方式可以用于将Dolby AC-3代码转换成 BSAC (比特分片算术编码)格式(Kyoung Ho Bang, Young Cheol Park, and Dae Hee Youn (2006). Audio Transcoding Algorithm for Mobile Multimedia Application, /Voc. 。//CAS^尸,vol. 3)。在该特定示例中, AC-3比特分配可以重用于导出并控制BSAC编码器内的新比特分配 403。除了重用来自源比特流的辅助信息SI之外,时间-频率合成和分 解过程在时间上取得同步。对于这种情况,图4a)的先进概念与前述 代码转换方案相比,降低了计算复杂度,并可以使目标信号的质量变 得更好。当(且仅当)源和目标比特流的编解码器格式在其时间-频率分解 域方面相同时,即,当分解和合成模块完全互补时(例如mp3比特流 从给定数据速率至更低数据速率的代码转换),可以如图4b)所示进 一步简化代码转换可以省略时间-频率分解和合成过程,以便例如通 过重新量化特定参数,直接在参数域PD中进行数据速率修改。重用 来自源比特流的辅助信息(例如比特分配)也是有益的。
技术实现思路
从以上描述中显而易见,缺少一种用于在具有不同时间-频率分解 域的编码格式间进行代码转换的简单方法和设备。本专利技术的一个方面 在于提供这样的方法和设备,特别用于在具有不同时间-频率分解域的 音频信号间方便地、更快速地进行代码转换。本专利技术使用从源参数域至目标参数域的线性映射,其中目标参数 依赖于来自两个或更多个输入帧的源参数。这允许了不同时间-频率分 解域间的低复杂度代码转换,并防止了传统处理所造成的信号恶化问 题。已经认识到,传统的代码转换方式中的时间-频率合成及随后的时 间-频率分解可以表示为线性操作,然而,它们通常是时变的。根据本专利技术的一个方面, 一种用于将音频信号从第一或输入参数 域(与时域相对)代码转换至第二或输出参数域的方法包括以下步骤: 将输入参数域的参数映射至输出参数域的参数,其中至少一个输出参 数线性依赖于两个或更多个输入参数(即该输出参数是两个或更多个 输入参数的线性组合)。这两个或更多个输入参数来自两个或更多个不 同的输入帧。在一个实施例中,用于描述所述输出参数与所述两个或更多个输 入参数之间关系的映射或变换是时变的。然而,对于具有帧结构的输 入和/或输出格式,该映射或变换是多个时不变关系的序列。在输入参 数域的时间-频率分解与输出参数域的时间-频率合成的帧前移(用于 描述帧的时间重叠)不同的情况下,这是特别有利的。在一个实施例中,时变映射周期性地重复,即,该映射是时不变 映射的周期性重复。在一个实施例中,该映射包括以下子步骤对来自不同源帧的部 分输入向量进行映射,然后将这些向量相加或叠加为单个输出帧。在一个实施例中,基于与整数个输出帧相对应的整数个输入帧来 创建超帧。该整数依赖于输入与输出格式的帧长度和帧偏移。 一个超 帧可以对应于时变映射的一个或多个重复周期。在一个实施例中,时变关系的每个时不变阶段表示为如下线性操 作从输入格式信号的多个连续帧得到输入,并针对本文档来自技高网
...

【技术保护点】
一种用于将成帧后的音频信号从第一参数域(PD↓[A])代码转换至第二参数域(PD↓[B])的方法,包括以下步骤: -在不创建时域音频信号的情况下,将所述第一参数域(PD↓[A])的两个或更多个参数线性变换(T↓[T])为所述第二参数域 (PD↓[B])的至少一个参数,其中,所述第一参数域的所述两个或更多个参数来自所述第一参数域中的音频信号的不同帧,并且是通过时间-频率变换而获得的。

【技术特征摘要】
【国外来华专利技术】EP 2006-9-20 06120969.81.一种用于将成帧后的音频信号从第一参数域(PDA)代码转换至第二参数域(PDB)的方法,包括以下步骤-在不创建时域音频信号的情况下,将所述第一参数域(PDA)的两个或更多个参数线性变换(TT)为所述第二参数域(PDB)的至少一个参数,其中,所述第一参数域的所述两个或更多个参数来自所述第一参数域中的音频信号的不同帧,并且是通过时间-频率变换而获得的。2. 根据权利要求l所述的方法,其中,所述将所述两个或更多个 输入参数线性变换为所述至少一个输出参数的步骤是时变的。3. 根据权利要求2所述的方法,其中,所述时变线性变换是多个 时不变线性变换的周期性重复。4. 根据权利要求2或3所述的方法,其中,所述第二参数域(PDb) 中实质上所有的参数都是从所述第一参数域(PDA)的线性变换后的 参数而获得的,所述线性变换是非平凡的。5. 根据权利要求3或4所述的方法,其中,所述周期性重复的一个 周期覆盖了与所述第二参数域(PDb)的不同整数数目的帧相对应的 所述第一参数域(PDA)的整数数目的帧。6. 根据权利要求2至5之一所述的方法,其中,所述第一和第二参 数域基于使用时间分解窗口的时间-频率分解,所述第二参数域(PDb) 的时间-频率分解使用长分解窗口和短分解窗口,而且对于长分解窗口 和短分解窗口,所述线性变换(TT)是不同的。7. 根据前述权利要求之一所述的方法,其中,所述线性变换(TT) 的步骤包括以下步骤-将来自不同输入帧的部分输入向量映射至部分输出向量;以及 -将所述部分输出向量叠加以产生输出帧。8. 根据前述权利要求之一所述的方法,其中,所述对所述第一参 数域的两个或更多个参数进行线性变换的步骤包括使用具有变换系 数的查找表。9. 根据前述权利要求之一所述的方法,其中,所述对所述第一参 数域的两个或更多个参数进行线性变换的步骤包括使用预定义解析 表达式。10. —种用于将成帧后的音频信号从第一参数域(PDA)代码转换至第二参数域(PDB...

【专利技术属性】
技术研发人员:彼得杰克斯斯文科登
申请(专利权)人:汤姆森许可贸易公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1