一种音频码率控制方法及系统技术方案

技术编号:3841261 阅读:200 留言:0更新日期:2012-04-11 18:40
本发明专利技术实施例公开了一种音频码率控制方法及系统。所述方法包括:根据可用比特数确定进行初次编码的子带;根据所述子带的掩蔽阈值计算所述子带的有效比例因子的初始值;根据所述子带的有效比例因子的初始值调整所述有效比例因子,使得所述子带频域系数的量化噪声小于所述掩蔽阈值,根据所述有效比例因子对所述子带进行量化,对量化后的频域系数进行编码,确定编码所需比特数;当编码所需比特数大于所述可用比特数时,通过分步调整子带的有效比例因子来调整编码所需比特数,使编码所需比特数小于或等于所述可用比特数。能够在降低算法复杂度的基础上兼顾声音质量。

【技术实现步骤摘要】

本专利技术主要涉及音频编解码领域,尤其涉及一种音频码率控制方法及系统
技术介绍
传统的数字音频压缩技术主要采用波形编码,通过降低数据的熵冗余度, 实现对数据的压缩。这种方法没有考虑到人耳听觉效果的主观特性,算法压缩率较低,音质也较差,其主要用于窄带音频信号的压缩,如A律编码。为了 在有限的网络带宽上传输更好的声音质量,一种基于人耳主观感知特征的音频 压缩技术得到了发展,相关方面先后制定了 MPEG-1 Audio、 MPEG-2Audio、 MPEG-2 AAC (Advanced Audio Coding,高级音频编码)、Dolby(AC國3)、 MPEG國4 AAC等音频压缩标准。这种音频数据压缩方法充分利用人耳听觉系统的感知 特性,在原始数据中去掉人耳无法听到的信号细节,从而实现了较低码率下的 宽频语音或音频信号的编码。经过这种方法压缩的音频信号虽然存在失真,但 是这些失真人耳是听不到的,对人耳是"透明"的,也就是说对人耳的听觉是 没有影响的。现有技术在比特分配和量化的过程中,AAC规范中釆用 一种被广泛使用 的基于两层嵌套循环的比特分配方案,ACC标准通过两层循环来调整各个子 带的比例因子的大小,并以此来实现各个子带间的比特分配,其中外层循环用 来控制各个子带的量化噪声不超过掩蔽阈值,内层循环用来控制量化编码频域 系数所需要的比特数不超过当前可用比特数,这两层循环交替进行,直到两层 循环的控制条件都被满足或别的退出条件被满足。如图l所示,内层循环根据 全局比例因子对频域系统进行量化和编码,并统计编码比特数,若编码所需比 特数大于可用比特数,则增大全局比例因子,重复上述过程直到编码所需比特 数小于可用比特数。如图2所示,外层循环计算每个比例因子带的量化噪声,并将每个比例因子带的量化噪声控制在心理声学模型计算出的掩蔽阈值范围 内。当某个比例因子带的量化噪声超过掩蔽阈值时,则增加该比例因子带的比 例因子,通过降低量化步长来减少量化噪声,尽可能地使该比例因子带的量化 噪声小于掩蔽阈值。在所述的外层循环中,各子带的频域系数被由比例因子所 确定的量化步长进行量化,得到量化系数,接着量化系数又被反量化得到反量 化系数,然后由频域系数与反量化系数相减得到各个子带的量化噪声。在内层 循环中,同样,各个子带的频域系数被量化成量化系数,然后量化系数被编码 成相应的码字,再统计这些码字的总长度,这个长度加上其它一些辅助信息的 编码长度后就得到了编码所需的比特数。专利技术人在实现本专利技术的过程中发现,现有技术至少存在以下缺点现有技 术需要进行大量的运算,计算复杂。内层循环对频域系数进行量化和编码,各 比例因子带遍历一次,计算复杂;外层循环计算每个比例因子带的量化噪声, 只要有一个子带不满足要求,就会再次调用内层循环,导致内层循环运行次数 增多,算法运算量增大。
技术实现思路
本专利技术实施例提出一种音频码率控制方法及系统,能够在降低算法复杂度 的基础上兼顾声音质量。本专利技术实施例的技术方案是这样实现的一种音频码率控制方法,包括根据可用比特数确定进行初次编码的子带;根据所述子带的掩蔽阈值计算所述子带的有效比例因子的初始值;才艮据所述子带的有效比例因子的初始值调整所述有效比例因子d吏得所述 子带频域系数的量化噪声小于所述掩蔽阈值,根据所述有效比例因子对所述子 带进行量化,对量化后的频域系数进行编码,确定编码所需比特数;当编码所需比特数大于所述可用比特数时,通过分步调整子带的有效比例因子来调整编码所需比特数。一种音频码率控制系统,包括第一确定单元,用于根据可用比特数确定进行初次编码的子带;第一计算单元,用于根据所述子带的掩蔽阈值计算所述子带的有效比例因子的初始l直;第一编码单元,用于根据所述子带的有效比例因子的初始值调整所述有效 比例因子,使得所述子带频域系数的量化噪声小于所述掩蔽阈值,根据所述有 效比例因子对所述子带进行量化,对量化后的频域系数进行编码,确定编码所 需比特数;判断单元,用于判断编码所需比特数是否大于所述可用比特数; 调整单元,用于当编码所需比特数大于所述可用比特数时,通过分步调整子带的有效比例因子来调整编码所需比特数,使编码所需比特数小于或等于所述可用比特数。本专利技术实施例所述技术方案将比特分配、量化编码过程拆分成两个独立的 循环,大大降低了计算复杂度,在量化噪声、编码码率不能同时满足要求时, 通过分步调整各个子带的有效比例因子来降低编码比特数,从而有利于保持较 高的语音质量,在降低算法复杂度的基础上兼顾了声音质量。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施 例或现有技术描迷中所需要使用的附图作简单地介绍,显而易见地,下面描述 中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付 出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为现有技术AAC规范中比特分配方法的内层循环示意流程图2为现有技术AAC规范中比特分配方法的外层循环示意流程图3为子带编码示意图4为现有技术中MPEG-4 AAC的编码流程示意图5为本专利技术一种音频码率控制方法第一实施例的流程图6为本专利技术一种音频码率控制方法第二实施例的流程图7为本专利技术一种音频码率控制方法第三实施例的流程图8为本专利技术一种音频码率控制方法第四实施例的流程图9为本专利技术一种音频码率控制系统第一实施例的组成结构7图10为本专利技术一种音频码率控制系统第二实施例的组成结构图; 图11为本专利技术一种音频码率控制系统第三实施例的组成结构图; 图12为本专利技术一种音频码率控制系统第四实施例的组成结构图。具体实施例方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是 全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造 性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。为了更清楚的阐述本专利技术实施例的技术方案,下面先以MPEG-4 AAC音 频编码算法为例,阐述基于人耳听觉系统感知特性的音频编码器的关键技术点 和编》马过禾呈。1、所述关键技术点包括心理声学模型和子带编码。(1) 心理声学模型主要用来描述人耳听觉系统对声音的感知特性,是所 有基于感知音频编码算法的核心。其主要利用了人耳听觉的两个特性来进行压 缩编码听觉阈度、掩蔽效应。听觉阈度人耳对声音的感知在频率、响度上都有一定范围。频率方面, 正常人可以听到20Hz 20000Hz的声音信号;响度方面,人耳对不同频率的响 度有一条听阈曲线,在这条曲线之下的对应频率的信号是听不到的。此外人耳 对不同频率的声音敏感程度差别很大,其中对2000Hz 4000Hz范围的信号最 敏感,幅度很低的信号都能被人耳听到,而对于高频信号,敏感程度明显降低。掩蔽效应 一种频率的声音阻碍听觉系统感知另一种频率的声音的现象称 为掩蔽效应。两个声音的频率越接近,相互的掩蔽效应越明显;低频信号对高 频信号掩蔽作用明显,但高频信号对低频信号的掩蔽效应不明显。对于被掩蔽 的信号可以不参与编码,从而降低编码速率。(2) 子带编码如图3所述,子带编码将信号在频域划分成N个子带(比例因子带),每 个比例因子带内包含若干本文档来自技高网
...

【技术保护点】
一种音频码率控制方法,其特征在于,包括: 根据可用比特数确定进行初次编码的子带; 根据所述子带的掩蔽阈值计算所述子带的有效比例因子的初始值; 根据所述子带的有效比例因子的初始值调整所述有效比例因子,使得所述子带频域系数的量 化噪声小于所述掩蔽阈值,根据所述有效比例因子对所述子带进行量化,对量化后的频域系数进行编码,确定编码所需比特数; 当编码所需比特数大于所述可用比特数时,通过分步调整子带的有效比例因子来调整编码所需比特数。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵云轩
申请(专利权)人:深圳华为通信技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1