一种高效感知音频比特分配方法组成比例

技术编号：3048266 阅读：239 留言：0更新日期：2012-04-11 18:40

本发明专利技术属于音频编码技术领域，涉及一种高效感知音频比特分配方法，包括下列步骤：建立基于心理声学的人耳听觉模型，根据它计算频谱包络的掩蔽特性，确定比特分配的掩蔽曲线；根据ＳＮＲｏｆｆｓｅｔ公式，一次逼近比特分配参数的初值，由比特分配的掩蔽曲线与比特分配参数共同计算出噪声容限，计算得到比特分配指针；采用循环迭代的方式对比特分配参数进行ＳＮＲｏｆｆｓｅｔ步长调节将允许的最大限度的比特数分配给所有的声道，如果当前分配的比特数超过允许分配的比特数，下一次计算时减小ＳＮＲｏｆｆｓｅｔ的值；否则增加ＳＮＲｏｆｆｓｅｔ的值，如此反复计算直到比特池中的可用比特数得到最大限度的利用。本发明专利技术在保证比特分配精度的同时有效的降低了比特分配叠代的次数，从而实现种高效感知音频比特分配。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于音频编码
，具体涉及一种数字音频感知编码的比特分配方法。
技术介绍
近些年来，CD音质的数字音频己经足以取代模拟音频。网络、无线以及多媒体计算系统等新出现的应用面临着一系列的限制，如信道带宽的降低、存储容量的限制以及低成本的要求。这些新的应用也产生了低码率下传输高质量数字音频的需要。针对这一需求，己经有很多研究致力于高保真(CD音质)数字音频的感知透明编码。目前的主流音频编码技术都是基于人耳感知模型的有损编码系统，利用感知无关和统计冗余来获得编码增益。感知音频编码器的通用结构如图1所示。通用的感知音频编码器由滤波器组、心理声学模型、比特分配与量化、熵编码以及码流格式化模块组成。输入信号被分段成持续时间2到50ms之间的为平稳帧，然后时间-频率分析模块计算每帧的时间和频率分量。通常时-频映射要尽量与人耳听觉系统的分析特性相匹配，从而由输入音频提取出一套在感知失真尺度下易于量化与编码的时-频参数。心理声学模型对输入音频信号进行分析，根据人耳听觉模型的听觉阈值和掩蔽效应去除信号中感知无关的分量，并进一歩确定编码输入信号所需的比特数。心理声学研究认为人耳能否听见声音取决于声音的频率，幅度是否高于这种频率下的听觉阈值，低频区的频率分辨率高于高频区。如果信号频率中有低于绝对听觉阈值的部分，那么这部分信号可舍弃而不被人耳觉察；如果某一频率的声音幅度小于另一声音的听觉阈值，并在其掩蔽范围内，则该声音被掩蔽；同样，某噪声幅度在某一声音的听觉阈值内，该噪声也被掩蔽。有关掩蔽曲线模型详细内容可参见朱丽，郭从良发表的论文心理声学模...

【技术保护点】
一种高效感知音频比特分配方法，包括下列步骤：　第一步：建立基于心理声学的人耳听觉模型，根据它计算频谱包络的掩蔽特性，从而确定比特分配的掩蔽曲线；　第二步：根据下列公式，一次逼近比特分配参数的初值，式中，ｂｉｔｌｅｆｔ是比特剩余数，ｎｂｉｎ是量化谱线的个数：　ｓｎｒｏｆｆｓｅｔ＝ｂｉｔｌｅｆｔ／ｎｂｉｎ×１２８；　第三步：由比特分配的掩蔽曲线与比特分配参数共同计算出噪声容限，计算得到比特分配指针。　第四步：，采用循环迭代的方式对比特分配参数进行ＳＮＲｏｆｆｓｅｔ步长调节将允许的最大限度的比特数分配给所有的声道，如果当前分配的比特数超过允许分配的比特数，下一次计算时减小ＳＮＲｏｆｆｓｅｔ的值；否则增加ＳＮＲｏｆｆｓｅｔ的值，如此反复计算直到比特池中的可用比特数得到最大限度的利用。

【技术特征摘要】
1. 一种高效感知音频比特分配方法，包括下列步骤第一步建立基于心理声学的人耳听觉模型，根据它计算频谱包络的掩蔽特性，从而确定比特分配的掩蔽曲线；第二步根据下列公式，一次逼近比特分配参数的初值，式中，bitleft是比特剩余数，nbin是量化谱线的个数snroffset＝bitleft/nbin×128;第三步由比特分配的掩蔽曲线与比特分配参数共同计算出噪声容限，计算得到比特分配指针。第四步，采用循环迭代的方式对比特分配参数进行SNRoffset步长调节将允许的最大限度的比特数分配给所有的声道，如果当前分配的比特数超过允许分配的比特数，下一次计算时减小SNRoffset的值；否则增加SNRoffset的值，如此反复计算直到比特池中的可用比特数得到最大限度的利用。2. 根据权利要求l所述的高效感知音频比特分配方法，其特征在于，第四歩的歩长调节按下列步骤执行(1) 给定第一迭代次数N1，第二迭代次数N2以及初始调节步长S1，设当前处于初步概略态；(2) 如果处于初步概略态，统计迭代次数，当迭代次数超过第一迭代次数...

【专利技术属性】
技术研发人员：张涛，要强，刘宝琦，陈存彪，李海，
申请(专利权)人：天津大学，
类型：发明
国别省市：12[中国|天津]

全部详细技术资料下载我是这个专利的主人