具有并行架构的音频编码器制造技术

技术编号:10362088 阅读:155 留言:0更新日期:2014-08-27 18:11
本文献涉及用于音频编码的方法及系统。具体地,本文献涉及利用并行系统架构进行快速音频编码的方法及系统。描述了包括K个并行变换单元(303,403)的基于帧的音频编码器(300,400,500,600);其中,K个并行变换单元(303,403)中的每一个被配置成:将音频信号(101)的K个帧(305)的组中的相应帧转换为K个频率系数集合中的相应集合;其中K>1;其中,K个帧(305)中的每一个包括音频信号(101)的多个样本。

【技术实现步骤摘要】
【国外来华专利技术】具有并行架构的音频编码器相关申请的交叉引用本申请要求于2011年11月30日提交的美国临时专利申请第61/565,037号的优先权,在此通过引用将其全部内容合并到本申请中。
本文献涉及用于音频编码的方法及系统。具体地,本文献涉及使用并行编码器架构的快速音频编码的方法及系统。
技术介绍
当今的媒体播放器支持各种不同的音频格式比如mp3、mp4、WMA(Windows媒体音频)、AAC (高级音频编码)>HE-AAC (高效率的AAC)等。另一方面,媒体数据库(比如Simfy)提供数以百万计的音频文件以供下载。通常,以各种不同的音频格式以及可以由不同媒体播放器支持的各种不同比特率对这些数以百万计的音频文件进行编码以及存储是不经济的。如此,提供如下快速音频编码方案是有利的:该方案使得音频文件的编码能够“实时(on the fly) ”,从而使得媒体数据库当被请求时能够产生特定编码的音频文件(以特定的音频格式,以特定的比特率)。
技术实现思路
根据一个方面,描述了一种基于帧的音频编码器。该音频编码器可以被配置成:将包括多个时域样本的音频信号划分成帧的序列,其中,每个帧通常包括预定数目的样本。作为示例,帧可以包括固定数目M个样本(例如M= 1024)。在一种实施方式中,音频编码器被配置成进行高级音频编码(AAC)。音频编码器可以包括对音频信号的K个帧(例如音频信号的K个连续的帧)并行地进行处理的K个并行变换单元。K个并行变换单元可以在K个不同的处理单元(例如图形处理单元)上实现,从而(与对K个帧的顺序处理相比)将变换处理加速了因子K。变换单元可以被配置成将帧变换为频率系数集合。换言之,变换单元可以执行时域到频域的变换,比如修正离散余弦变换(MDCT)。同样地,K个并行变换单元中的每一个可以被配置成:将音频信号的K个帧的组(也称为帧组)的相应帧变换为K个频率系数集合中的相应集合。K 可以大于 1、2、3、4、5、10、20、50、100。如上面所表明的,K个并行变换单元可以被配置成向帧组中的K个帧分别应用MDCT。此外,K个并行变换单元可以被配置成向帧组中的K个帧分别应用窗函数。应当注意,应用于帧的变换的类型和/或窗的类型通常取决于帧的类型(即,本文中也称为块类型的帧类型)。同样地,K个并行变换单元可以被配置成将K个帧分别变换为K个取决于帧类型的频率系数集合。音频编码器可以包括K个并行信号起奏(attack)检测单元。信号起奏检测单元可以被配置成:将音频信号的帧分类为包括声音起奏的帧(例如瞬态帧)或分类为不包括声音起奏的帧(例如调性(tonal)帧)。同样地,K个并行信号起奏检测单元可以被配置成:基于K个帧中的相应帧中声音起奏的有或无分别对帧组的K个帧进行分类。K个并行信号起奏检测单元可以在至少K个不同的处理单元上实现。具体地,K个并行信号起奏检测单元可以与K个并行变换单元在相同的相应的处理单元上实现。音频编码器还可以包括帧类型检测单元,其被配置成基于对K个帧的分类来确定K个帧中的每一个帧的帧类型。帧类型的示例有短块类型(其通常用于包括瞬态音频信号的帧)、长块类型(其通常用于包括调性音频信号的帧)、开始块类型(其通常用作从长块类型到短块类型的过渡帧)和/或停止类型(其通常用作从短块类型到长块类型的过渡帧)。如此,帧的帧类型可以取决于一个或更多个先前帧的帧类型。因此,帧类型检测单元可以被配置成:还基于先前帧k-ι的帧类型来确定K个帧中的帧k的帧类型,其中k =1,...,K。作为示例,帧类型检测单元可以被配置成:如果帧k被分类为包括起奏并且如果其先前帧k-Ι是短块类型或是开始块类型,则确定帧k(k = I,…,K)是短块类型。帧类型检测单元可以被配置成:如果帧k被分类为不包括起奏并且如果其先前帧k-Ι是长块类型或是停止块类型,则确定帧k(k = I,…,K)是长块类型。帧类型检测单元可以被配置成:如果帧k被分类为包括起奏并且如果其先前帧k-ι是长块类型,则确定帧k(k= 1,...,!()是开始块类型。此外,帧类型检测单元可以被配置成:如果帧k被分类为不包括起奏并且如果其先前帧k-Ι是短块类型,则确定帧k(k = I,…,K)是停止块类型。K个并行变换单元可以与K个并行信号起奏检测单元以及帧类型检测单元并行操作。如此,K个并行变换单元可以在与K个并行信号起奏检测单元不同的处理单元上实现,从而使得能够在至少2K个处理单元上对编码器进行进一步的并行化。在这样的情况下,变换单元可以被配置成执行取决于帧类型的窗口化和/或变换处理的推测执行。具体地,变换单元可以被配置成为帧组中的相应帧确定多个取决于帧类型的频率系数集合。更具体地,变换单元可以被配置成针对帧的每一种可能的帧类型确定取决于帧类型的频率系数集合。音频编码器则可以包括选择单元,其被配置成:从多个取决于帧类型的频率系数集合中(针对K个帧中的每一个帧)选择合适的频率系数集合,其中,合适的频率系数集合与相应帧的帧类型对应。可替代地,K个并行信号起奏检测单元可以与帧类型检测单元顺序地操作并且与K个并行变换单元顺序地操作。如此,K个并行信号起奏检测单元可以在与K个并行变换单元相同的相应的处理单元上实现。在该情况下,K个并行变换单元可以知道相应帧的帧类型,以使得K个并行变换单元可以被配置成:将K个帧变换为与相应帧的帧类型对应的取决于帧类型的相应频率系数集合。 音频编码器可以包括K个并行量化与编码单元。K个并行量化与编码单元可以在至少K个不同的处理单元(例如K个并行变换单元的相应的处理单元)上实现。量化与编码单元可以被配置成:考虑相应的所分配的比特数目来分别对频率系数集合进行量化和熵编码(例如霍夫曼编码)。换言之,帧组的K个帧的量化和编码可以由K个并行的量化与编码单元独立执行。为此,向K个并行量化与编码单元提供相应的所分配的比特数目的K个指示。如下面将要概述的,可以针对帧组在联合比特分配处理中联合确定相应的所分配的比特数目的指示。音频编码器还可以包括K个并行心理声学单元。K个并行心理声学单元可以在至少K个不同的处理单元上实现。通常,K个并行心理声学单元可以在与K个并行变换单元相同的相应的处理单元上实现,因为K个并行心理声学单元通常还对由K个并行变换单元提供的相应的K个频率系数集合进行处理。K个并行心理声学单元可以被配置成:基于K个频率系数集合来分别确定一个或更多个取决于帧(并且通常取决于频率)的掩蔽阈值。可替代地或另外地,K个并行心理声学单元可以被配置成针对帧组的对应的K个帧确定K个感知熵值。一般而言,感知熵值提供了对对应的帧的信息内容的指示。通常,感知熵值与应该用于对对应的帧进行编码的比特数目的估计对应。具体地,给定帧的感知熵值可以表明:在分配给量化帧的噪声正好在一个或更多个掩蔽阈值以下这个假设下,对给定帧进行量化和编码需要多少比特。K个并行量化与编码单元可以被配置成:考虑到相应的一个或更多个取决于帧的掩蔽阈值,分别对K个频率系数集合进行量化和熵编码。如此,可以确保频率系数集合的量化是考虑心理声学而进行的,因此减小了听得见的量化噪声。音频编码器可以包括比特分配单元,其被配置成:分别向K个并行量化与编码单元分配相应的比特数目。为此,比特分配单元可以考虑本文档来自技高网...

【技术保护点】
一种基于帧的音频编码器(300,400,500,600),包括K个并行变换单元(303,403);其中,所述K个并行变换单元(303,403)中的每一个被配置成:将音频信号(101)的K个帧(305)的组中的相应帧变换成K个频率系数集合中的相应集合;其中K>1;其中,所述K个帧(305)中的每一个包括所述音频信号(101)的多个样本。

【技术特征摘要】
【国外来华专利技术】2011.12.21 US 61/578,3761.一种基于帧的音频编码器(300,400,500,600),包括 K个并行变换单元(303,403);其中,所述K个并行变换单元(303,403)中的每一个被配置成:将音频信号(101)的K个帧(305)的组中的相应帧变换成K个频率系数集合中的相应集合;其中K>1 ;其中,所述K个帧(305)中的每一个包括所述音频信号(101)的多个样本。2.根据权利要求1所述的音频编码器(300,400,500,600),其中,所述K个并行变换单元(303,403)中的每一个被配置成:向所述K个帧(305)中的相应帧应用修正离散余弦变换。3.根据任一前述权利要求所述的音频编码器(300,400,500,600),其中,所述K个并行变换单元(303,403)中的每一个被配置成:向所述K个帧(305)中的相应帧应用窗函数。4.根据任一前述权利要求所述的音频编码器(300,400,500,600),其中,所述K个并行变换单元(303,403)中的每一个被配置成:将所述K个帧(305)中的相应帧变换成取决于帧类型的频率系数集合。5.根据权利要求4所述的音频编码器(300,400,500,600),还包括: K个并行信号起奏检测单元(301),其中,每个信号起奏检测单元(301)被配置成:基于所述K个帧(305)中的相应帧中声音起奏的有或无,对所述K个帧(305)中的相应帧进行分类。6.根据权利要求5所 述的音频编码器(300,400,500,600),还包括: 帧类型检测单元(304),被配置成:基于对所述K个帧的分类来确定所述K个帧(305)中的每一个帧的帧类型。7.根据权利要求6所述的音频编码器(300,400,500,600),其中,所述帧类型是短块类型、长块类型、开始块类型和停止类型之一。8.根据权利要求6至7中任一项所述的音频编码器(300,400,500,600),其中,所述帧类型检测单元(304)被配置成:还基于帧k-Ι的帧类型确定所述K个帧(305)中的每个帧k的帧类型,其中k = 1,…,K。9.根据权利要求6至8中任一项所述的音频编码器(400),其中,所述K个并行变换单元(403)与所述K个并行信号起奏检测单元(301)和所述帧类型检测单元(304)并行操作。10.根据权利要求6至9中任一项所述的音频编码器(400),其中 所述K个并行变换单元(303、403)中的每一个被配置成:将所述K个帧(305)中的相应帧变换为多个取决于帧类型的频率系数集合;以及 所述编码器(400)还包括选择单元(406),所述选择单元(406)被配置成:从所述多个取决于帧类型的频率系数集合中为所述K个帧(305)中的每一帧选择频率系数集合,其中,所选择的集合与所述相应帧的帧类型对应。11.根据权利要求6至8中任一项所述的音频编码器(400),其中,所述K个并行信号起奏检测单元(301)与所述帧类型检测单元(304)顺序地操作,所述帧类型检测单元(304)与所述K个并行变换单元(403)顺序地操作。12.根据权利要求6至8以及11中任一项所述的音频编码器(300,500,600),其中,所述K个并行变换单元(303)的每一个被配置成:将所述K个帧(305)中的相应帧变换成与所述帧类型检测单元(304)所确定的所述相应帧的帧类型对应的频率系数集合。13.根据任一前述权利要求所述的音频编码器(300,400,500,600),还包括: K个并行量化与编码单元(508,608);其中,所述K个并行量化与编码单元(508,608)中的每一个被配置成:考虑相应的所分配比特数目来对所述K个频率系数集合中的相应集合进行量化和熵编码。14.根据权利要求13所述的音频编码器(300,400,500,600),还包括: K个并行心理声学单兀(506);其中,所述K个并行心理声学单兀(506)中的每一个被配置成:基于所述K个频率系数集合中的相应集合来确定一个或更多个取决于帧的掩蔽阈值。15.根据权利要求14所述的音频编码器(300,400,500,600),其中,所述K个并行心理声学单元(506)中的每一个被配置成:对表示所述K个帧(305)中的相应帧的信息内容的感知熵值进行确定。16.根据权利要求14至15中任一项所述的音频编码器(300,400,500,600),其中,所述K个并行量化与编码单元(508、608)中的每一个被配置成:考虑相应的一个或更多个取决于帧的掩蔽阈值来对所述K个频率系数集合中的相应集合进行量化和熵编码。17.根据权利要求13至16中任一项所述的音频编码器(300,400,500,600),还包括: 比特分配单元(507,607),被配置成:向所述K个并行量化与编码单元(508,608)中的每一个分配相应的比特数目。18.根据从属于权 利要求6的权利要求17所述的音频编码器(300,400,500,600),其中,所述比特分配单元(507,607)被配置成:考虑所述K个帧(305)的帧类型来分配相应的比特数目。19.根据权利要求15所述的音频编码器(300,400,500,600),其中,所述比特分配单元(507,607)被配置成:考虑所述K个帧(305)的感知熵值来分配相应的比特数目。20.根据权利要求17至19中任一项所述的音频编码器(300,400,500,600),还包括: 比特储存器跟踪单元(509,609),被配置成:对用于对所述音频信号(101)的在所述K个帧(305)之前的帧进行编码的先前消耗的比特数目进行跟踪。21.根据权利要求20所述的音频编码器(300,400,500,600),其中,所述比特储存器跟踪单元(509,609)被配置成:用被所述K个并行量化与编码单元(508,608)用于对所述频率系数集合进行编码的比特数目来更新先前消耗的比特数目,从而产生当前消耗的比特数目。22.根据权利要求20至21中任一项所述的音频编码器(300,400,500,600),其中,所述比特分配单元(507,607)被配置成:考虑先前消耗的比特数目来分配相应的比特数目。23.根据权利要求20至22中任一项所述的音频编码器(300,400,500,600),其中,所述比特分配单元(507,607)被配置成:考虑用于...

【专利技术属性】
技术研发人员:沃尔夫冈·席尔德巴赫
申请(专利权)人:杜比国际公司
类型:发明
国别省市:荷兰;NL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利