加速量化循环程序功能的音频编码方法技术

技术编号:3424941 阅读:216 留言:0更新日期:2012-04-11 18:40
一种音频编码方法利用预先估计总体增益的初始值及量化因子初始值,以提供较佳的迭代初始值于量化循环中,避免庞大计算量的需求状况。此编码方法的初始值估计程序包含根据一输入帧的采样率、比特率与声道数目、及心理声学模型计算一配置比特数目;分析出每一量化因子频带中,具有最大能量的一频域采样,将该频域采样的比特数目量化成该配置比特数目,并产生相对应的一量化因子;分析出对应于该输入帧的所有量化因子频带的一最大量化因子;及根据最大量化因子及相对应的量化因子设定量化循环程序的总体增益及量化因子初始值。

【技术实现步骤摘要】

本专利技术提供一种音频编码方法,尤指一种加速量化循环程序功能的音频 编石马方法。
技术介绍
目前有许多编码器依据人类听觉系统的特性而采用特殊的编码算法,可将数字音频数据压缩至十倍以上,譬如第三代音频压缩技术(MPEG audio layer III, MP3)、先进音频编码技术(Advanced Audio Coding, AAC)、及杜比数 字编码技术(DolbyDigital)等,这些编码器采用了知觉编码、频域编码、视窗 切换及动态比特分配等技术来消除原始音频数据中不必要的内容。请参考图1,图1为一已知音频编码方法的流程图。图1的已知音频编 码方法包含下列步骤步骤SI00:输入一脉冲编码调制(pulse code modulation, PCM)帧; 步骤S110:将输入帧由时域转换至频域,并产生相对应于该输入帧的频 域采样;步骤S130:执行可用比特数目分析,用以计算一可用比特数目;步骤S140:重置外部量化循环编码程序的迭代变量;步骤S150:判断是否所有频域采样的能量均为零,若是,则执行步骤 S170,否则,执行步骤S160;步骤S160:执行外部量化循环编码程序以输出一编码帧;步骤S170:执行未使用比特数目分析,用以计算一未使用比特数目, 提供后续信号处理可利用比特信息;以及步骤S180:结束。在已知音频编码的迭代处理过程中,由于迭代变量,例如量化因子 (scalefactor)与总体增益(global gain),进入外部量化循环编码程时的起始系值 皆设定为零,在此情况下,所提供的迭代变量的初始值与迭代变量的目标值 相差就会很大,所以需要花费较大的计算量以执行外部量化循环编码程序,才能获得所要的迭代目标值,如此一来,很难满足在应用系统中效率上的需 求。
技术实现思路
本专利技术的实施例所提供的具,用 以编码一输入帧,以输出一编码帧,此方法包含根据一输入帧产生多个子带 采样,每一子带采样包含多个量化因子频带,执行心理声学模型(psychoacoustic model)分析以产生一屏蔽曲线,根据一输入帧的一采样率、 一比特率与一声道数目、及该屏蔽曲线计算对应于该目前帧的子带采样的每一量化因子频带的一频域采样的一配置比特数目,分析出每一量化因子频带 具有最大能量的一频域采样,将每一量化因子频带具有最大能量的该频域采 样的比特数目,以量化步长(quantization step)量化成对应于该频域采样的该 配置比特数目,并产生相对应的一第一量化因子,根据这些量化因子频带的 相对应于这些最大能量的这些频域采样的这些第一量化因子,分析出对应于 这些量化因子频带的一最大第一量化因子,根据该最大第一量化因子计算一 总体增益,将这些第一量化因子分别减去该最大第一量化因子以产生多个第 二量化因子,设定该总体增益及这些第二量化因子为执行一外部量化循环编 码程序时,对应于每一量化因子频带所需的一总体增益初始值及一量化因子 初始值,以及根据对应于每一量化因子频带的该总体增益初始值及该量化因 子初始值执行该外部量化循环编码程序以产生该编码帧。附图说明图1显示一已知音频编码方法的流程图。 图2显示根据本专利技术一实施例的音频编码方法的流程图。 图3显示根据本专利技术一实施例的音频编码方法的流程图。 图4显示根据本专利技术一实施例的音频编码方法的流程图。主要元件符号说明S100-S180、 步骤 S200-S255、 S300-S375、 S400-S48具体实施例方式为让本专利技术的目的、特征和优点更显而易懂,下文依本专利技术的音频编码 方法,特举实施例配合所附方法流程图作详细说明,但所提供的实施例并不 用以限制本专利技术所涵盖的技术范围,而方法流程步骤编号更非用以限制其执 行先后次序,任何由方法步骤重新组合的执行流程,所产生的具有加速量化 循环程序功能的方法,均为本专利技术所涵盖的技术范围。请参考图2,图2为根据本专利技术一实施例的音频编码方法的流程图。图 2的音频编码方法包含下列步骤步骤S200:输入一脉冲编码调制帧;步骤S210:将该输入帧由时域转换至频域,并产生相对应于该输入帧 的频域采样,其中,该频域分为多个量化因子频带;步骤S220 步骤S225 步骤S230执行可用比特数目分析,用以计算一可用比特数目; 重置外部量化循环编码程序的迭代变量; 执行心理声学模型分析以产生一屏蔽曲线;步骤S235:根据该频域采样估计量化因子的初始值及总体增益的初始值;步骤S240:判断是否所有频域采样的能量均为零,若是,则执行步骤 S250,否则,执行步骤S245;步骤S245:根据对应于每一量化因子频带的总体增益初始值及量化因 子初始值执行外部量化循环编码程序以输出 一编码帧;步骤S250:执行未使用比特数目分析,用以计算一未使用比特数目, 提供后续信号处理可利用比特信息;以及步骤S255:结束。在上述音频编码方法之中,步骤S235所估计的量化因子初始值及总体 增益初始值,是根据输入帧所对应的频域采样特性所产生,也就是说,执行 外部量化循环编码程序所需的量化因子初始值及总体增益初始值是先经过 初步计算,所以不会造成迭代初始值与目标值的极大差异,因此庞大计算量 的需求状况即可避免。此外,在步骤S210中,以MP3编码应用为例,更可包含执行脉冲编码 调制输入帧的多相滤波处理以产生多个子带采样(subband samples);与执行这些子带采样的修正离散余弦转换(modified discrete cosine transform, MDCT),将子带采样进一步细分为多个长视窗子带采样或多个短视窗子带采 样,以获得较好的频镨解析度。若以AAC编码应用为例,则可省去多相滤 波处理的步骤。在步骤S245中,执行外部量化循环编码程序包含进行一内部量化循环 编码程序,内部量化循环编码程序根据总体增益执行一量化程序,内部量化 循环编码程序包含计算量化程序编码一量化值所需的一比特数目,譬如分析 基于霍夫曼编码方案(Huffman encoding scheme)而执行MP3编码量化值所需 的比特数目,内部量化循环编码程序另包含当所计算的该比特数目大于一配 置比特数目时,调整总体增益以继续执行内部量化循环编码程序。步骤S250 可以包含利用未使用的多个比特执行对应于下一帧的每一量化因子频带的 一频域采样的一配置比特数目的分析计算。请参考图3,图3为根据本专利技术一实施例的音频编码方法的流程图。图 3的音频编码方法包含下列步骤步骤S300:输入一脉冲编码调制帧;步骤S310:将该输入帧由时域转换至频域,并产生相对应于该输入帧的频域采样,其中,该频域分为多个量化因子频带;步骤S315:执行可用比特数目分析,用以计算一可用比特数目;步骤S320:重置外部量化循环编码程序的迭代变量;步骤S325:执行心理声学模型分析以产生一屏蔽曲线;步骤S330:根据该输入帧的一采样率、 一比特率与一声道数目、及该屏蔽曲线计算对应于该输入帧的每一量化因子频带的一频域采样的一配置比特数目;步骤S335:分析出每一量化因子频带中,具有最大能量的一频域采样; 步骤S340:将每一量化因子频带中,具有最大能量的该频域采样的比 特数目,以量化步长(quantization step)量化成对应于该频域采本文档来自技高网
...

【技术保护点】
一种音频编码方法,用以编码一输入帧,以输出一编码帧,该方法包含: 转换该输入帧至一频域,以输出多个频域采样; 根据这些频域采样以产生一组量化因子的初始值及一总体增益的初始值;以及 依据该组量化因子的初始值与该总体增益的初始值执行一循环以产生该编码帧。

【技术特征摘要】

【专利技术属性】
技术研发人员:王文浩
申请(专利权)人:瑞昱半导体股份有限公司
类型:发明
国别省市:71[中国|台湾]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1