【技术实现步骤摘要】
【国外来华专利技术】具有并行架构的音频编码器相关申请的交叉引用本申请要求于2011年11月30日提交的美国临时专利申请第61/565,037号的优先权,在此通过引用将其全部内容合并到本申请中。
本文献涉及用于音频编码的方法及系统。具体地,本文献涉及使用并行编码器架构的快速音频编码的方法及系统。
技术介绍
当今的媒体播放器支持各种不同的音频格式比如mp3、mp4、WMA(Windows媒体音频)、AAC (高级音频编码)>HE-AAC (高效率的AAC)等。另一方面,媒体数据库(比如Simfy)提供数以百万计的音频文件以供下载。通常,以各种不同的音频格式以及可以由不同媒体播放器支持的各种不同比特率对这些数以百万计的音频文件进行编码以及存储是不经济的。如此,提供如下快速音频编码方案是有利的:该方案使得音频文件的编码能够“实时(on the fly) ”,从而使得媒体数据库当被请求时能够产生特定编码的音频文件(以特定的音频格式,以特定的比特率)。
技术实现思路
根据一个方面,描述了一种基于帧的音频编码器。该音频编码器可以被配置成:将包括多个时域样本的音频信号划分成帧的序列,其中,每个帧通常包括预定数目的样本。作为示例,帧可以包括固定数目M个样本(例如M= 1024)。在一种实施方式中,音频编码器被配置成进行高级音频编码(AAC)。音频编码器可以包括对音频信号的K个帧(例如音频信号的K个连续的帧)并行地进行处理的K个并行变换单元。K个并行变换单元可以在K个不同的处理单元(例如图形处理单元)上实现,从而(与对K个帧的顺序处理相比)将变换处理加速了因子K。变换单元可以被配置 ...
【技术保护点】
一种基于帧的音频编码器(300,400,500,600),包括K个并行变换单元(303,403);其中,所述K个并行变换单元(303,403)中的每一个被配置成:将音频信号(101)的K个帧(305)的组中的相应帧变换成K个频率系数集合中的相应集合;其中K>1;其中,所述K个帧(305)中的每一个包括所述音频信号(101)的多个样本。
【技术特征摘要】
【国外来华专利技术】2011.12.21 US 61/578,3761.一种基于帧的音频编码器(300,400,500,600),包括 K个并行变换单元(303,403);其中,所述K个并行变换单元(303,403)中的每一个被配置成:将音频信号(101)的K个帧(305)的组中的相应帧变换成K个频率系数集合中的相应集合;其中K>1 ;其中,所述K个帧(305)中的每一个包括所述音频信号(101)的多个样本。2.根据权利要求1所述的音频编码器(300,400,500,600),其中,所述K个并行变换单元(303,403)中的每一个被配置成:向所述K个帧(305)中的相应帧应用修正离散余弦变换。3.根据任一前述权利要求所述的音频编码器(300,400,500,600),其中,所述K个并行变换单元(303,403)中的每一个被配置成:向所述K个帧(305)中的相应帧应用窗函数。4.根据任一前述权利要求所述的音频编码器(300,400,500,600),其中,所述K个并行变换单元(303,403)中的每一个被配置成:将所述K个帧(305)中的相应帧变换成取决于帧类型的频率系数集合。5.根据权利要求4所述的音频编码器(300,400,500,600),还包括: K个并行信号起奏检测单元(301),其中,每个信号起奏检测单元(301)被配置成:基于所述K个帧(305)中的相应帧中声音起奏的有或无,对所述K个帧(305)中的相应帧进行分类。6.根据权利要求5所 述的音频编码器(300,400,500,600),还包括: 帧类型检测单元(304),被配置成:基于对所述K个帧的分类来确定所述K个帧(305)中的每一个帧的帧类型。7.根据权利要求6所述的音频编码器(300,400,500,600),其中,所述帧类型是短块类型、长块类型、开始块类型和停止类型之一。8.根据权利要求6至7中任一项所述的音频编码器(300,400,500,600),其中,所述帧类型检测单元(304)被配置成:还基于帧k-Ι的帧类型确定所述K个帧(305)中的每个帧k的帧类型,其中k = 1,…,K。9.根据权利要求6至8中任一项所述的音频编码器(400),其中,所述K个并行变换单元(403)与所述K个并行信号起奏检测单元(301)和所述帧类型检测单元(304)并行操作。10.根据权利要求6至9中任一项所述的音频编码器(400),其中 所述K个并行变换单元(303、403)中的每一个被配置成:将所述K个帧(305)中的相应帧变换为多个取决于帧类型的频率系数集合;以及 所述编码器(400)还包括选择单元(406),所述选择单元(406)被配置成:从所述多个取决于帧类型的频率系数集合中为所述K个帧(305)中的每一帧选择频率系数集合,其中,所选择的集合与所述相应帧的帧类型对应。11.根据权利要求6至8中任一项所述的音频编码器(400),其中,所述K个并行信号起奏检测单元(301)与所述帧类型检测单元(304)顺序地操作,所述帧类型检测单元(304)与所述K个并行变换单元(403)顺序地操作。12.根据权利要求6至8以及11中任一项所述的音频编码器(300,500,600),其中,所述K个并行变换单元(303)的每一个被配置成:将所述K个帧(305)中的相应帧变换成与所述帧类型检测单元(304)所确定的所述相应帧的帧类型对应的频率系数集合。13.根据任一前述权利要求所述的音频编码器(300,400,500,600),还包括: K个并行量化与编码单元(508,608);其中,所述K个并行量化与编码单元(508,608)中的每一个被配置成:考虑相应的所分配比特数目来对所述K个频率系数集合中的相应集合进行量化和熵编码。14.根据权利要求13所述的音频编码器(300,400,500,600),还包括: K个并行心理声学单兀(506);其中,所述K个并行心理声学单兀(506)中的每一个被配置成:基于所述K个频率系数集合中的相应集合来确定一个或更多个取决于帧的掩蔽阈值。15.根据权利要求14所述的音频编码器(300,400,500,600),其中,所述K个并行心理声学单元(506)中的每一个被配置成:对表示所述K个帧(305)中的相应帧的信息内容的感知熵值进行确定。16.根据权利要求14至15中任一项所述的音频编码器(300,400,500,600),其中,所述K个并行量化与编码单元(508、608)中的每一个被配置成:考虑相应的一个或更多个取决于帧的掩蔽阈值来对所述K个频率系数集合中的相应集合进行量化和熵编码。17.根据权利要求13至16中任一项所述的音频编码器(300,400,500,600),还包括: 比特分配单元(507,607),被配置成:向所述K个并行量化与编码单元(508,608)中的每一个分配相应的比特数目。18.根据从属于权 利要求6的权利要求17所述的音频编码器(300,400,500,600),其中,所述比特分配单元(507,607)被配置成:考虑所述K个帧(305)的帧类型来分配相应的比特数目。19.根据权利要求15所述的音频编码器(300,400,500,600),其中,所述比特分配单元(507,607)被配置成:考虑所述K个帧(305)的感知熵值来分配相应的比特数目。20.根据权利要求17至19中任一项所述的音频编码器(300,400,500,600),还包括: 比特储存器跟踪单元(509,609),被配置成:对用于对所述音频信号(101)的在所述K个帧(305)之前的帧进行编码的先前消耗的比特数目进行跟踪。21.根据权利要求20所述的音频编码器(300,400,500,600),其中,所述比特储存器跟踪单元(509,609)被配置成:用被所述K个并行量化与编码单元(508,608)用于对所述频率系数集合进行编码的比特数目来更新先前消耗的比特数目,从而产生当前消耗的比特数目。22.根据权利要求20至21中任一项所述的音频编码器(300,400,500,600),其中,所述比特分配单元(507,607)被配置成:考虑先前消耗的比特数目来分配相应的比特数目。23.根据权利要求20至22中任一项所述的音频编码器(300,400,500,600),其中,所述比特分配单元(507,607)被配置成:考虑用于...
【专利技术属性】
技术研发人员:沃尔夫冈·席尔德巴赫,
申请(专利权)人:杜比国际公司,
类型:发明
国别省市:荷兰;NL
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。