用于编码/解码具有辅助信息的音频比特流的方法和设备技术

技术编号:3604031 阅读:195 留言:0更新日期:2012-04-11 18:40
提供了一种用于编码/解码具有辅助信息的MPEG-4位片算术编码(BSAC)音频比特流的方法和设备。所述编码方法包括:把时域音频信号转换为频域音频信号,并量化所述音频信号;对数据比特数进行计数;获得每一层可用的比特数;考虑到辅助信息的大小而修正每一层可用的比特数;以层为单位编码实际音频数据;并在编码比特流中嵌入辅助信息。所述解码方法包括:解码报头;计算音频比特流的层结构;将一直到顶层的数据的大小与帧的大小之间的差值确定为辅助信息的大小;根据所述辅助信息的大小,而提取所述辅助信息;并解码所述音频比特流。当通过持有辅助信息而提供使用BSAC的服务时,能改善音频内容的元数据和音质。

【技术实现步骤摘要】

本专利技术涉及MPEG音频比特流的编码/解码,并更具体地,涉及一种用于编码/解码具有辅助信息的MPEG-4位片算术编码(BSAC)音频比特流的方法和设备。
技术介绍
模拟波形是连续时间信号。因此,需要模数(A/D)转换来把所述模拟波形表现为离散时间信号。对A/D转换来说有两种处理是必需的。一种是把时间上的连续时间信号转换为离散时间信号的采样处理,另一种是利用有限数值来限制可能振幅数量的振幅量化处理。也就是说,振幅量化处理把时刻n的输入振幅x(n)转换成y(n),y(n)为可能振幅的有限集中的元素。 近来,在音频信号存储/恢复方法中,根据数字信号处理技术的发展,采样和量化典型模拟信号、把采样和量化后的信号转换成作为数字信号的脉码调制(PCM)数据、在记录/存储介质如压缩盘(CD)或数字音频磁带(DAT)中存储所述PCM数据、以及根据用户需求通过再现所存储的数据来收听所述PCM数据的技术已得到了发展。与采用模拟方法如慢转密纹唱片(LP)的磁带记录相比,通过应用利用数字方法的存储/恢复方法,可以获得较好的声音质量,并能防止由于存储持续时间所引起的恶化。但是,由于数字数据的大小很大,因此当进行存储或传输时会产生很多问题。 为了解决这些问题,人们努力采用用于压缩数字声音信号的差分脉码调制(DPCM)方法或自适应差分脉码调制(ADPCM)方法,来减少数据量。但是,DPCM或ADPCM方法的效率根据信号种类的不同而有很大差别。最近,在国际标准化组织(ISO)已实现标准化工作的运动图像专家组(MPEG)/音频技术或由Dolby Co.Ltd.所发展的AC-2/AC-3技术中,已经使用了利用心理声学建模减少数据量的方法。在不考虑信号特性的情况下,所述减少数据量的方法对有效减少数据量做出了很大贡献。 在传统的音频压缩技术如MPEG-1/音频、MPEG-2/音频、或AC-2/AC-3中,将时域信号捆绑(bound)成预定大小的块并转换成频域信号。利用心理声学建模对所转换的信号进行分级量化。所述量化技术简单,但即使输入样本统计上独立,所述量化技术也不最佳。此外,如果输入样本在统计上相关,则所述量化技术效率低下。由于这个原因,编码实现为包含无损编码如熵编码,或特定类型的自适应量化。因此执行相当复杂的处理,而不是存储单一PCM数据的方法,并且比特流由量化的PCM数据和用于信号压缩的辅助信息组成。 所述MPEG/音频标准或AC-2/AC-3方法提供了和具有64Kbps-384Kbps速率的CD音质一样良好的音质,该速率是传统数字编码速率的1/6至1/8。具有较高音质的MPEG/音频标准,在音频信号的存储与传输系统如数字音频广播(DAB)、因特网电话、音频点播(AOD)、及多媒体系统中,将扮演重要的角色。 在这些传统方法中,由于编码器提供了固定的比特率,且通过为所提供的比特率找到最佳状态来执行量化和编码处理,因此当固定比特率用于编码时,所述方法提供了良好的方案。然而,为了多媒体的用途,需要传统的低比特率编码和具有各种功能的编码器/解码器。其中一种是能控制比特率的音频编码器/解码器。所述比特率可控的音频编码器可以使用用高比特率编码的比特流来生成低比特率的比特流,并能仅利用一部分比特流来恢复上述比特流。因此,当网络超负载、解码器的性能不佳、或用户指令降低了比特率时,所述比特率可控的音频编码器应该利用部分比特流来恢复具有合理性能的音频信号,即使性能恶化得和降低的比特率一样。 允许存储辅助信息的语法,如data_stream_element()和fill_element(),在MPEG-2/4AAC(ISO/IEC 13818-7,ISO/IEC 14496-3)中。而且,MPEG-1的第3层(mp3)中定义了“辅助数据”。因此,可以通过把辅助信息嵌入到帧信息的中间,来存储音频辅助信息。ID3v1是这方面的代表性的例子。图11示出了ID3v1中的比特流结构。 然而,当前标准化的MPEG-4位片算术编码(BSAC)音频格式中没有定义允许提供辅助信息的语法。图12和13示出了BSAC语法中帧报头的定义。在BSAC中,由于帧报头中没有定义允许嵌入辅助信息的语法,因此根据标准,不可能把辅助信息嵌入到帧报头中。
技术实现思路
本专利技术提供了一种用于编码/解码具有辅助数据的MPEG-4位片算术编码(BSAC)音频比特流的方法和设备,可以通过在当前标准化的MPEG-4 BSAC音频格式中嵌入辅助信息的方式来改善音频内容的元数据或音质,从而提供与众不同的服务。 本专利技术还提供了一种区分在用MPEG-4 BSAC音频格式编码的音频数据中是否嵌入有辅助信息的方法。 根据本专利技术的一个方面,提供了一种编码具有辅助信息的MPEG-4 BSAC音频比特流的方法,所述方法包括把时域音频信号转换为频域音频信号,并用心理声学模型量化音频信号;对比特率受控的音频数据的比特数进行计数;利用要使用的比特数和要使用的层数而获得每一层可用的比特数;通过获得辅助信息的大小来修正每一层可用的比特数;以层为单位编码实际音频数据;及在编码比特流中嵌入辅助信息。 所述辅助信息可以是关于音质改进的信息。所述辅助信息还可以是关于音乐曲调的信息。 根据本专利技术的另一方面,提供了一种用于编码具有辅助信息的MPEG-4BSAC音频比特流的设备,所述设备包括量化处理器,用于将时域音频信号转换为频域音频信号,并利用心理声学模型而量化所述音频信号;可用比特计算器,用于利用音频数据的比特数和层数而获得每一层可用的比特数;可用比特修正器,用于通过获得辅助信息的大小,而修正由可用的比特计算器计算出的每一层的可用比特数;及比特封装单元,用于根据由可用比特修正器修正的每一层的可用比特数,而编码实际音频数据,并把辅助信息嵌入到编码比特流中。 所述可用比特计算器可以包括比特计数器,用于对比特率受控的音频信号的比特数进行计数;和副层可用比特计算器,用于利用由所述比特计数器计数得到的比特数和预定层数,而获得每一层可用的比特数。 根据本专利技术的另一个方面,提供了一种解码具有辅助信息的MPEG-4BSAC音频比特流的方法,所述方法包括解码音频比特流的报头;通过从报头信息中获得帧的大小,来计算音频比特流的层结构;从层结构中获得一直到顶层的数据大小和帧的大小,并将所述一直到顶层的数据的大小与帧的大小之间的差值确定为辅助信息的大小;根据所述辅助信息的大小,而从所述音频比特流中提取所述辅助信息;及根据所计算的层结构,而解码所述音频比特流一直到顶层。 根据本专利技术的另一个方面,提供了一种解码具有辅助信息的MPEG-4BSAC音频比特流的方法,所述方法包括解码比特流的报头;通过从报头信息中获得帧的大小,来计算比特流的层结构;对来自比特流的层结构的、与一直到顶层的音频数据大小相对应的音频数据进行解码;及提取剩余比特流作为辅助信息,并解码所述辅助信息。 所提取的辅助信息可以是关于音质改进的信息。所提取的辅助信息还可以是音频数据用户的音频元数据。 根据本专利技术的另一个方面,提供了一种用于区分在用MPEG-4 BSAC音频数据编码的音频数据中是否嵌入有辅助信息的方法,所述方法包括解码比特流的报头;通过从所述报头信息中获得帧的大小,来计算所述本文档来自技高网
...

【技术保护点】
一种用于编码具有辅助信息的MPEG-4BSAC音频比特流的方法,所述方法包括:把时域音频信号转换为频域音频信号,并利用心理声学模型对该音频信号进行量化;对比特率受控的音频数据的比特数进行计数;利用要使用的比特数和 要使用的层数而获得每一层可用的比特数;通过获得辅助信息的大小而修正每一层可用的比特数;以层为单位编码实际音频数据;及在编码比特流中嵌入辅助信息。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:金重会李时和金尚煜吴殷美金度亨
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:KR[韩国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1