当前位置: 首页 > 专利查询>天津大学专利>正文

一种高效感知音频比特分配方法组成比例

技术编号:3048266 阅读:239 留言:0更新日期:2012-04-11 18:40
本发明专利技术属于音频编码技术领域,涉及一种高效感知音频比特分配方法,包括下列步骤:建立基于心理声学的人耳听觉模型,根据它计算频谱包络的掩蔽特性,确定比特分配的掩蔽曲线;根据SNRoffset公式,一次逼近比特分配参数的初值,由比特分配的掩蔽曲线与比特分配参数共同计算出噪声容限,计算得到比特分配指针;采用循环迭代的方式对比特分配参数进行SNRoffset步长调节将允许的最大限度的比特数分配给所有的声道,如果当前分配的比特数超过允许分配的比特数,下一次计算时减小SNRoffset的值;否则增加SNRoffset的值,如此反复计算直到比特池中的可用比特数得到最大限度的利用。本发明专利技术在保证比特分配精度的同时有效的降低了比特分配叠代的次数,从而实现种高效感知音频比特分配。

【技术实现步骤摘要】

本专利技术属于音频编码
,具体涉及一种数字音频感知编码的比特分配方法。
技术介绍
近些年来,CD音质的数字音频己经足以取代模拟音频。网络、无线以及多媒体计算 系统等新出现的应用面临着一系列的限制,如信道带宽的降低、存储容量的限制以及低 成本的要求。这些新的应用也产生了低码率下传输高质量数字音频的需要。针对这一需 求,己经有很多研究致力于高保真(CD音质)数字音频的感知透明编码。目前的主流音频编码技术都是基于人耳感知模型的有损编码系统,利用感知无关和 统计冗余来获得编码增益。感知音频编码器的通用结构如图1所示。通用的感知音频编 码器由滤波器组、心理声学模型、比特分配与量化、熵编码以及码流格式化模块组成。输入信号被分段成持续时间2到50ms之间的为平稳帧,然后时间-频率分析模块计 算每帧的时间和频率分量。通常时-频映射要尽量与人耳听觉系统的分析特性相匹配,从 而由输入音频提取出一套在感知失真尺度下易于量化与编码的时-频参数。心理声学模型对输入音频信号进行分析,根据人耳听觉模型的听觉阈值和掩蔽效应 去除信号中感知无关的分量,并进一歩确定编码输入信号所需的比特数。心理声学研究 认为人耳能否听见声音取决于声音的频率,幅度是否高于这种频率下的听觉阈值,低 频区的频率分辨率高于高频区。如果信号频率中有低于绝对听觉阈值的部分,那么这部 分信号可舍弃而不被人耳觉察;如果某一频率的声音幅度小于另一声音的听觉阈值,并 在其掩蔽范围内,则该声音被掩蔽;同样,某噪声幅度在某一声音的听觉阈值内,该噪 声也被掩蔽。有关掩蔽曲线模型详细内容可参见朱丽,郭从良发表的论文心理声学模 型在数字音频中的应用(出处《电声技术》2002年第8期总第206期)。比特分配模块根据心理声学模型确定的比特需求为需要编码的输入信号分配比特量 化器使用比特分配模块分配的比特数来量化表示输入信号。熵编码模块对量化信息采用Huffman编码、算术编码等算法降低统计冗余度。码流格式化模块将一帧输入信号的编码表示按照一定的语法规范进行格式化,提供 码流信息、帧内辅助信息、帧数据和用户数据等。实际的编码系统通常被限制于一定的输出码率,即每帧音频输入信号的编码表示的 码字是受限的。为了在给定的码率限制下达到较好的编码质量,通常需要多次的比特分 配和量化编码尝试来决定合适的比特分配与量化编码。通常的比特分配与量化是以双层 循环叠代来实现的,内层循环负责对码率进行控制,外层循环负责对质量进行控制。比 特分配的双层循环叠代结构如图2所示。因此,在音频编码技术中,比特分配算法是整个编解码系统的核心部分,比特分配算法的性能直接影响着音频编码系统的性能,也是 最消耗计算资源的处理过程。衡量循环迭代性能的两个因素是精度和效率。目前关于高效比特分配的算法也主 要有两种,第一种是以牺牲精度为代价换取比特分配的高效率;第二种是利用相邻帧之 间信号的相关性预测比特分配信息,从而降低循环的运算量,在不损失精度的前提下提 高比特分配效率。如果目标码率足够高,那么牺牲精度的算法可能是可以接受的,但是 在必须对码率进行严格限制的情况下它是不可接受的。而第二种算法是基于帧间较好的 相关性,而对于经常出现的剧烈变化的序列,效率明显降低。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提供一种高效的感知音频比特分配方法。 该方法基于人耳的感知模型,通过对比特分配参数与信号掩蔽比之间的定量分析,精确 计算比特分配参数的初值(一次逼近),然后再经过临界收敛控制的叠代循环确定最佳比特分配参数。具体步骤如下第一步建立基于心理声学的人耳听觉模型,根据它计算频谱包络的掩蔽特性,从 而确定比特分配的掩蔽曲线;第二步根据下列公式, 一次逼近比特分配参数的初值,式中,bitleft是比特剩余 数,nbin是量化谱线的个数5Woj^e/ = Z /f/e// / wZ)/w x 128 ,第三步由比特分配的掩蔽曲线与比特分配参数共同计算出噪声容限,计算得到比特分配指针。第四步,采用循环迭代的方式对比特分配参数进行SNRoffset步长调节将允许的最大限度的比特数分配给所有的声道,如果当前分配的比特数超过允许分配的比特数,下一次计算时减小SNRoffset的值;否则增加SNRoffset的值,如此反复计算直到比特 池中的可用比特数得到最大限度的利用。第四步的歩长调节按下列步骤执行(1) 给定第一迭代次数N1,第二迭代次数N2以及初始调节步长S1,设当前处于 初歩概略态;(2) 如果处于初步概略态,统计迭代次数,当迭代次数超过第一迭代次数N1时, 设定步长为最大调节步长S2,进入超快速收敛态。(3 ) 根据噪声门限进行比特分配;(4) 当处于初歩概略态时,以初始调节步长S1,并根据bitleft/bitref來修正 步长,从而调整SNRoffset;当处于超快速收敛态时,以最大调节步长S2调整 SNRoffset;当处于临界收敛搜索态时,以最小调节歩长S3调整SNRoffset。(5) 判断bitleft与bitref是否异号,若是,则判断步长是否最小,若已经为 最小,则比特分配完成并退出迭代,若步长并不是最小,则将调节步长设为最小 调节步长S3进入临界收敛搜索态;(6) 返回歩骤(2)继续执行迭代循环。本专利技术提供了一种新的高效的感知音频比特分配方法。该方法基于人耳的感知模型, 通过对比特分配参数与信号掩蔽比之间的定量分析,精确计算比特分配参数的初值(一 次逼近),然后再经过临界收敛控制的叠代循环确定最佳比特分配参数。由于每帧信号 进行一次精确的比特分配参数初值的计算,因此可以很好的逼近最优值,保证后面的迭 代过程快速收敛,有效地降低了迭代循环次数;同时,由于每帧只计算一次比特分配参 数初值,因而计算开销也很小。因此该方法在保证比特分配精度的同时有效的降低了比 特分配叠代的次数,从而实现了一种高效的感知音频比特分配。附图说明图l是感知音频编码器结构框图2是现有技术中双层循环比特分配结构框图3是本专利技术的感知音频比特分配流程图4是本专利技术应用于AC-3音频编码器的比特剩余与其他方法的对比; 图5是本专利技术应用于AC-3音频编码器的平均迭代次数与其他方法的对比; 图6是本专利技术应用于AC-3音频编码器的最大迭代次数与其他方法的对比。具体实施例方式本专利技术是一种通过定量分析与计算一次逼近比特分配参数的初值再经过临界收敛控 制的迭代循环确定最佳比特分配参数的高效感知音频比特分配方法。主要步骤如下:第一步计算掩蔽曲线它包含一个基于人耳听觉的参数模型,根据它计算频谱包络的掩蔽特性来确定比特分配的掩蔽曲线。 第二步 一次逼近比特分配参数的初值。第三歩计算噪声门限。由比特分配得到的掩蔽曲线与比特分配参数共同计算出噪 声门限,计算得到比特分配指针。第四步编码器循环迭代对比特分配参数进行粗步长调节,将允许的最大限度的比 特数分配给所有的声道。(图中的N1, N2均为迭代步长的门限,可以依实际情况设定)。 如果当前分配的比特数超过允许分配的比特数,下一次计算时减小SNRoffset的值;否 则增加SNRoffset的值,这种反复计算直到比特池中的可用比特数得到最大的利用。下面结合附图和实施例对本专利技术做进一步详述。实施例h本实施例是基于PC本文档来自技高网
...

【技术保护点】
一种高效感知音频比特分配方法,包括下列步骤: 第一步:建立基于心理声学的人耳听觉模型,根据它计算频谱包络的掩蔽特性,从而确定比特分配的掩蔽曲线; 第二步:根据下列公式,一次逼近比特分配参数的初值,式中,bitleft是比特剩余数 ,nbin是量化谱线的个数: snroffset=bitleft/nbin×128; 第三步:由比特分配的掩蔽曲线与比特分配参数共同计算出噪声容限,计算得到比特分配指针。 第四步:,采用循环迭代的方式对比特分配参数进行SN Roffset步长调节将允许的最大限度的比特数分配给所有的声道,如果当前分配的比特数超过允许分配的比特数,下一次计算时减小SNRoffset的值;否则增加SNRoffset的值,如此反复计算直到比特池中的可用比特数得到最大限度的利用。

【技术特征摘要】
1. 一种高效感知音频比特分配方法,包括下列步骤第一步建立基于心理声学的人耳听觉模型,根据它计算频谱包络的掩蔽特性,从而确定比特分配的掩蔽曲线;第二步根据下列公式,一次逼近比特分配参数的初值,式中,bitleft是比特剩余数,nbin是量化谱线的个数snroffset=bitleft/nbin×128;第三步由比特分配的掩蔽曲线与比特分配参数共同计算出噪声容限,计算得到比特分配指针。第四步,采用循环迭代的方式对比特分配参数进行SNRoffset步长调节将允许的最大限度的比特数分配给所有的声道,如果当前分配的比特数超过允许分配的比特数,下一次计算时减小SNRoffset的值;否则增加SNRoffset的值,如此反复计算直到比特池中的可用比特数得到最大限度的利用。2. 根据权利要求l所述的高效感知音频比特分配方法,其特征在于,第四歩的歩长调节 按下列步骤执行(1) 给定第一迭代次数N1,第二迭代次数N2以及初始调节步长S1,设当前处于 初步概略态;(2) 如果处于初步概略态,统计迭代次数,当迭代次数超过第一迭代次数...

【专利技术属性】
技术研发人员:张涛要强刘宝琦陈存彪李海
申请(专利权)人:天津大学
类型:发明
国别省市:12[中国|天津]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1