用于预测性视频编码器的基于模型的速率控制制造技术

技术编号:3585813 阅读:227 留言:0更新日期:2012-04-11 18:40
提供一种实时单向可变比特率控制策略,以在视频压缩系统(图1)中实现可变比特率(VBR)MPEG-2编码。对于一序列帧,视频区间(即图片组(GOP))的编码难度的级别由知觉速率量化(C-Q)模型(图1的101)来确定。该模型对每个视频区间指派一个合成的(C-Q)曲线,从该曲线估计用于该视频区间的比特数。该估计依赖于因果预测模型,该因果预测模型利用了从先前编码的视频区间获取的参数。基于被分析的视频区间的总速率(图1的103),更新每个图片的R-Q关系以及指派图片比特。在整个场景变换和不稳定中,可变比特率控制策略的粗糙度分别通过应用,例如一非线性中值滤波器,和低通滤波器(图1的101)得以确保。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及视频编码器,并且更具体而言涉及速率受控的预测性视频编码器。
技术介绍
速率控制是多数视频编码器的基本功能。这部分是由于下面的事实尽管许多编码器将视频作为可变比特率流进行编码,但是很多应用要求恒定的比特率流。然而,多数视频标准并没有规定如何控制比特率。 常规编码器通过改变量化步骤的粗糙度来控制输出比特率。量化标度(quantization scale)的改变直接影响输出的大小。尽管粗糙的量化显著降低比特率,但是它也降低了图片的质量。因此,为了以避免显示图片中出现可见伪像的方式来分布可用的比特,需要更高级的速率控制算法。 已经提出了许多速率控制算法,诸如那些所公开的ISOIEC/JTC1/SC29/SG11的“MPEG2Test Model5,”草案,1993年4月,以及Zhihai He和Sanjit K.Mitra的“Optimum Bit Allocationand Accurate Rate Control for Video Coding via ρ-domain SourceModeling”,IEEE Transactions on Circuits and System for VideoTechnology,2002年10月。先行方法也已经被引入速率控制,用于在由于诸如场景变化而引起图片特征明显变化的情况下稳定速率控制。这样的速率控制方案通常包括两个步骤。第一个步骤是向给定图片集合中的每个图片分配比特以最小化总失真。第二个步骤是找到符合所分配的比特数的量化参数以对当前图片进行编码。上述速率控制方案用于第二步骤中(即,选择量化参数)。然而,该两步方法使得速率控制复杂化了。
技术实现思路
因此,本专利技术的目的是提供用于预测性视频编码器的基于模型的速率控制算法,该速率控制算法基本消除了一个或多个由相关技术的限制和缺点导致的问题。 本专利技术的一个优点是它提供了精确的速率控制,而只需要比已知的速率控制方案低许多的复杂度。这可以通过使用适应视频序列的局部特性的速率模型,以及通过以在给定的图片集合GOP中尽可能地将量化参数保持恒定作为目标来实现,而不是两步方法。 本专利技术的另一个优点是它提供了适应视频序列的局部特性的图片成本的函数的速率模型。 本专利技术的其它特征和优点将在随后的描述中阐述,其中部分将通过描述而变得显而易见,或可以通过实施本专利技术来获知。通过书面说明书及其权利要求和附图中特别指出的结构将实现并获得本专利技术的目的和其他优点。 为了实现这些以及其他优点,并且根据本专利技术的目的,如所具体化并广泛描述的,一种用于在预测性视频编码器中提供速率控制的方法包括将视频序列中的图片分类、估计第一量化参数、基于所估计的量化参数计算视频序列中每个图片的图片成本(picture cost)、初始化速率控制、基于图片成本执行比特分配和量化参数选择以及编码该视频序列。 应理解上述总体描述以及下面的详细描述是示例性和解释性的,并且意在提供对所请求保护的专利技术的进一步解释。 附图说明 附解了本专利技术的实施方案并且与说明书一起用于解释本专利技术的原理,附图被包括用于提供对本专利技术的进一步理解并且被纳入和构成本说明书的一部分。 在附图中 图1是根据本专利技术的实施方案的视频编码器的方框图; 图2图解了根据本专利技术的实施方案的用于估计量化参数的示例伪C代码; 图3图解了根据本专利技术的实施方案的示例图片分类。 具体实施例方式 现在详细参考本专利技术的实施方案,其例子在附图中进行了说明。 本专利技术提供了一种基于预测性视频编码器的速率模型的自适应速率控制算法。该速率模型是称为图片成本的成本的函数,其被表示为预测成本和剩余成本的加权总和,并且适应视频序列的局部特征。如在此所使用的预测成本表示产生误差图片所需的比特的估计数,并且如在此所使用的剩余成本描述对产生的误差图片进行编码的难度。自适应模型用于估计编码图片所需的比特数。此外,该模型可以包括场景变化检测器、静止图片检测器和动画(flash)检测器以更精确地适应图片的特征。 出于示例的目的,关于利用GOP结构中的I、P和B图片在H.264视频编码器中的实现描述根据本专利技术的自适应模型。然而,本领域技术人员将很容易理解本专利技术的自适应模型可以应用于其他视频编码系统标准,诸如任何MPEG标准。 如图1中所示,示例编码器100具有两个功能模块预处理器101以及主处理器103。预处理器101读取一系列的输入视频帧,检测场景变化、动画和/或静止图片,以及基于视频帧内的信息确定GOP的大小。预处理器101还估计被用于计算GOP中图片的预测和剩余成本的量化参数(QP)。主处理器103通过执行速率控制、运动估计、模式选择以及熵编码来处理每个图片。 预处理器101的第一个步骤是分类场景以使速率控制稳定。预处理器101通过确定场景变换、动画图片以及静止图片来分类场景。图片n和先前图片n-1之间的场景变化是基于M×N大小的共址块的平均值的差别和这些块的绝对差的总和(SAD)来确定的。 例如可以通过将当前图片的平均值和先前图片的平均值之间的差别与预定阈值进行比较以及比较当前图片像素和先前图片中对应像素之间的差别的平均值来确定当前图片和先前图片之间的改变数量,来检测场景的变化。如果变化的数量大于阈值,那么就已经有场景变化。 接着,预处理器确定所检测的场景变化是否是真实的场景变化或相反是动画图片。如果当前图片n被确定为场景变化,但是下一个图片n+1类似于先前的图片n-1,那么当前的图片就被认为是动画图片而不是场景变化图片,并且该动画标志被设置为打开,而场景变化标志被设置为关闭。 当检测到静止图片时,标志与图片中静止宏块的数量(num_still_mb)一起被转发到主处理器。检测静止图片的示例方法通过确定图片中静止宏块的数量而开始。例如,这可以通过将宏块的绝对差的总和(SAD)与指定的阈值StillMBthres进行比较来实现。如果图片中静止宏块的百分比大于指定的值,例如96%,并且成本预测小于指定的阈值,那么就认为图片是静止的。 预处理器还基于场景变化的位置来设置GOP大小GOPSIZE,或者如果在例如15个的指定图片数量内没有发生场景变化,该预处理器则设置最大的GOP大小。GOP通常具有不超过一个设置有场景变化标志的图片,并且开始于I图片。 接着,预处理器估计将被用于计算GOP中图片的预测成本和剩余成本的量化参数QP1。随着量化参数的下降,预测成本和剩余成本都趋向于增加。因此,用于成本计算的量化参数(QP1)和用于实际编码的量化参数(QP2)之间的明显差别将导致主处理器不能精确估计每个图片所要求的比特数,并且因此处理器不能提供精确的速率控制。为了使得图片的预测成本和剩余成本对主处理器中的速率控制更有用,基于图片的时空复杂度、目标比特率以及每秒的宏块数量来估计QP1。由于对邻近的GOP使用不同的QP使得成本更少相关,所以来自先前GOP的QP保持不变,除非发生场景变化,或者场景复杂度有很大改变。图2图解了用于估计QP1的示例伪C代码算法。 基于对量化参数QP1的估计,预处理器计算成本。对当前GOP中的每个图片计算预测成本和剩余成本,predCost[i]和resiCost[i],在场编码模式中i=0,1本文档来自技高网
...

【技术保护点】
一种在预测性视频编码器中执行速率控制的方法,包括:将视频序列中的图片分类;估计第一量化参数;基于估计的量化参数计算视频序列中每个图片的图片成本;初始化速率控制数据;基于图片成本和速率控制数据执行比特分配和量化参数选择;编码视频序列;以及更新速率控制数据。

【技术特征摘要】
【国外来华专利技术】US 2005-3-9 11/074,6611.一种在预测性视频编码器中执行速率控制的方法,包括将视频序列中的图片分类;估计第一量化参数;基于估计的量化参数计算视频序列中每个图片的图片成本;初始化速率控制数据;基于图片成本和速率控制数据执行比特分配和量化参数选择;编码视频序列;以及更新速率控制数据。2.根据权利要求1所述的方法,其中所述图片成本是预测成本和剩余成本的加权总和。3.根据权利要求2所述的方法,其中所述预测成本是产生误差图片所需的比特数的估计,以及所述剩余成本描述了编码所得误差图片的难度。4.根据权利要求1所述的方法,其中将视频序列中的图片分类包括检测视频序列中的场景变化;以及基于所检测的场景变化设置图片组(GOP)的大小。5.根据权利要求1所述的方法,进一步包括将GOP中的每个图片分类,其中分类表征不同的编码方案以及一定参考图片的可用性。6.根据权利要求5所述的方法,其中通过用于编码具体分类中的图片的平均量化参数、用于该分类的平均预测成本、用于该分类的平均剩余成本、预测成本和所用的实际比特数之间的关系、剩余成本和编码图片所用的实际比特数之间的关系以及总图片成本来表征每个分类...

【专利技术属性】
技术研发人员:KH杨HJ金
申请(专利权)人:EG技术有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利