处理音频信号的装置和方法制造方法及图纸

技术编号:3044616 阅读:134 留言:0更新日期:2012-04-11 18:40
在一个实施方式中,从音频信号获取采样信息和帧长度信息。采样信息指音频信号中的每个声道的音频数据采样的总数,而帧长度信息指每个声道的一个帧中的采样数。判断如果将采样信息除以帧长度信息是否存在余数,且如果存在余数,则将音频信号中的帧数确定为采样信息除以帧信息的整数值加一。另外,如果判断步骤判定存在余数,则可基于余数设定最末帧的长度。数据采样基于所确定的帧数进行解码。

【技术实现步骤摘要】
【国外来华专利技术】专利技术背景本专利技术涉及一种处理音频信号的方法,尤其涉及一种编码和解码音频信号 的方法和装置。过去曾经以不同方法实现了音频信号的存储和重放。例如,音乐和语音业 己通过留声技术(例如唱盘播放机)、磁技术(例如卡式磁带)和数字技术(例 如光盘)来记录和保存。随着音频存储技术的发展,需要克服许多难题来优化 音频信号的质量和可存储性。为了音乐信号的存档和宽带传输,无损重建成为比借助诸如MP3或AAC 等在MPEG标准中定义的感性编码高效率压縮更为重要的特征。虽然DVD音频和超级CD音频包括专有无损压縮方案,但是在内容持有 者和广播公司当中需要一种开放和综合性的压縮方案。响应于这种需要, 一种 新的无损编码方案已经成为MPEG-4音频标准的延伸。无损音频编码法由于原 始信号的完美重建而实现了没有任何质量损失的数字音频数据压縮。
技术实现思路
本专利技术涉及处理音频信号的方法。在一个实施方式中,从音频信号获取采样信息和帧长度信息。采样信息指 音频信号中的每个声道的音频数据采样的总数,而帧长度信息指每个声道的一 个帧中的采样数。判断如果将采样信息除以帧长度信息是否存在余数,且如果 存在余数,则将音频信号中的帧数确定为釆样信息除以帧信息的整数值加一。 另外,如果判断步骤判定存在余数,则可基于余数设定最末帧的长度。数据采 样基于所确定的帧数进行解码。在一个实施方式中,最末帧的长度设定为等于该余数。在另一实施方式中,如果判断步骤判定不存在余数,则音频信号的帧数被 确定为采样信息除以帧信息的整数值。本专利技术还涉及编码音频信号的方法和装置,并涉及解码音频信号的方法和装置。附图简要说明包括于此以提供对本专利技术的进一步理解、并被结合在本申请中且构成其一 部分的附图示出本专利技术的实施方式,其与说明书一起可用来解释本专利技术的原 理。在附图中附图说明图1是根据本专利技术一个实施方式的编码器的示例图。图2是根据本专利技术一个实施方式的解码器的示例图。图3是根据本专利技术一个实施方式的压縮的M-声道文件的比特流结构的示例图。 图4是根据本专利技术一个实施方式的分级块切换方法的概念图的示例图。 图5是块切换示例及相应的块切换信息代码的示例图。图6是根据本专利技术实施方式的多个声道的块切换方法的示例图。具体实施方式下面将详细参考本专利技术的较佳实施方式,其具体示例图示于附图中。只要有 可能,即在所有附图中使用相同的附图标记表示相同或相似的部件。在对本专利技术进行叙述之前,应当指出的是本专利技术中揭示的大多数术语对应于 本领域内公知的一般术语,但部分术语是由申请人根据需要选择的,并且将在本发 明下文的描述中予以揭示。因此,由申请人定义的术语优选基于它们在本专利技术中的 含义来理解。在无损音频编码方法中,由于编码进程必须是可以完美逆转而不会有信息损 失的,因此编码器和解码器两者的若干部件必须以确定性的方式来实现。 编码解码器结构图1是根据本专利技术一个的编码器1的示例图。分割部件100将输入的音频数据分割成若干帧。在一个帧之中,每个声道还 可进一步被细分成若干个音频采样块以做进一步处理。缓存器110存储由分割部件 100分割后的块和/或帧采样。系数估算部件120针对每个块估算最佳的一组系数值。系数的数量,即预测 器的阶数也可以适应性地做出选择。系数估算部件120针对数字音频数据块计算一 组部分自相关系数(parcor)值。部分自相关系数值指示预测器系数的部分自相关 系数表示。量化部件130将该组部分自相关系数值量化。第一熵编码部件140通过从部分自相关系数值减去一个偏移值来计算出部分 自相关系数余数,并使用由熵参数所确定的熵代码对部分自相关系数的余数值进行 编码,其中偏移值和熵参数选自最佳表。最佳表是基于数字音频数据块的采样速率 从多个表中选择的。分别对多个采样速率范围预定义多个表以实现为了传输而进行 的数字音频数据的最佳压縮。系数转换部件150将量化了的部分自相关系数转换成线性预测编码(LPC)系数。预测器160使用线性预测编码系数从存储在缓存器110中的之前原始采样估算 当前预测值。减法器170使用存储在缓存器110中的数字音频数据的原始值和预测 器160中估算的预测值计算数字音频数据块的预测余数。第二熵编码部件180使用不同的熵代码编码预测余数并生成代码索引。所选 代码的索引作为辅助信息发送。第二熵代码部件180使用具有不同复杂度的两种可 供选择的编码技术对预测余数进行编码。一种编码技术是公知的Golomb-Rice编码 法(在下文中简称为Rice码)而另一种是公知的分块Gilbert-Moore代码法(在 下文中简称为BGMC) 。 Rice码复杂度低但仍然是有效的。BGMC算术编码方案以 比Rice码复杂度稍高为代价提供更好的压縮。最后,多路复用部件190将编码预测余数、代码索引、编码部分自相关系数 余数值和其它附加信息进行多路复用形成压縮比特流。编码器1还提供循环冗余检验(CRC)检验和,它主要是供解码器校验解码的 数据。在编码器方面,CRC可用来确保压縮数据是能够进行无损解码的。其它编码选项包括柔性块切换方案、随机存取和联合声道编码。编码器l可 使用这些选项提供若干具有不同复杂度的压縮级别。联合声道编码利用立体声声道 或多声道信号之间的相关性。这可通过在能够比原始信道之一更为有效地编码两个 声道之间的差异的片段(segments)中编码这种差异来实现。这些编码选项将在对 根据本专利技术的示例性解码器进行说明之后更为详细地予以说明。图2是根据本专利技术一个实施方式的解码器的示例图。更特别地,图2示出由 于不必执行任何调适因而复杂度显著低于编码器的无损音频信号解码器。多路分解部件200接收音频信号并将编码数字音频数据块的预测余数、代码 索引、编码部分自相关系数余数值和其它附加信息多路分解。第一熵解码部件210 使用由熵参数确定的熵代码对部分自相关系数余数值进行解码并通过将偏移值加 至解码部分自相关系数余数值来计算出一组部分自相关系数值;其中的偏移值和熵 参数选自一个表,该表是由解码器基于数字音频数据块的采样速率从多个表中选择的。第二熵解码部件220使用代码系数对经多路分解后的编码预测余数进行解码。系数转换部件230将熵解码的自相关系数值转换成LPC系数。预测器240使用LPC 系数估算数字音频数据块的预测余数。加法器250将解码预测余数加至估算的预测 余数以获得数字音频数据的原始块。组装部件260将解码块数据组装成帧数据。因此,解码器2将编码预测余数和自相关系数余数解码,将自相关系数余数 值转换成LPC系数,并应用反向预估滤波器计算无损重建信号。解码器2的计算工 作取决于由编码器1选择的预坝〖阶数(prediction orders)。 在大多数情形下,实时解码即使在低端系统中也是可能的。 图3是根据本专利技术的包括多个声道的(例如M个声道)压縮音频信号的比特 流结构的示例图。比特流由至少一个包括多个声道(例如M个声道)的音频帧构成。比特流配 置语法(见下面的表6)中的声道字段指示声道数。每个声道利用根据本专利技术 的块切换方案分成多个块,这将在后面详细说明。每个再分块具有不同的大小并包 括根据图l编码法的编码数据。例如, 一个再分块中的编码数据包含代码索引、预测阶数K、预测器系数和编 码余数值。如本文档来自技高网...

【技术保护点】
一种处理音频信号的方法,其包括:    从音频信号获取指示音频信号中每个声道的音频数据采样的总数的采样信息;    从音频信号获取指示每个声道的一个帧中的采样数的帧长度信息;    确定如果所述采样信息除以所述帧长度信息是否存在余数;    如果所述确定步骤确定有余数存在,则将音频信号中的帧数确定为采样信息除以帧信息的整数值加一;    如果所述确定步骤确定有余数存在,则基于余数设定音频信号中最末帧的长度;以及    基于所确定的帧数解码所述数据采样。

【技术特征摘要】
【国外来华专利技术】US 2005-7-11 60/697,551;KR 2005-7-16 PCT/KR2005/001.一种处理音频信号的方法,其包括从音频信号获取指示音频信号中每个声道的音频数据采样的总数的采样信息;从音频信号获取指示每个声道的一个帧中的采样数的帧长度信息;确定如果所述采样信息除以所述帧长度信息是否存在余数;如果所述确定步骤确定有余数存在,则将音频信号中的帧数确定为采样信息除以帧信息的整数值加一;如果所述确定步骤确定有余数存在,则基于余数设定音频信号中最末帧的长度;以及基于所确定的帧数解码所述数据采样。2. 如权利要求l所述的方法,其特征在于,所述设定步骤将最末帧的长 度设定为等于余数。3. 如权利要求l所述的方法,还包括如果所述确定步骤确定无余数存在,则将音频信号中的帧数确定为采样信 息除以帧信息得到的整数值。4. 如权利要求3所述的方法,还包括如果所述确定步骤确定余数不存在, 则将最末帧的长度设定为等于帧信息。5. 如权利要求1所述的方法,其特征在于,所述获取采样信息的步骤从音 频信号的配置信息中的采样字段获取采样信息。6. 如权利要求l所述的方法,其特征在于,所述获取帧长度信息的步骤从 音频信号的配置信息中的frame—length字段获取帧长度信息。7. —种处理音频信号的方法,...

【专利技术属性】
技术研发人员:T利伯成
申请(专利权)人:LG电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1