当前位置: 首页 > 专利查询>清华大学专利>正文

一种基于帧间模式统计分类的H.264宏块模式选择方法技术

技术编号:3586499 阅读:332 留言:0更新日期:2012-04-11 18:40
一种基于统计分类的H.264帧间模式选择方法属于视频编码技术领域,其特征在于,包含如下步骤:利用前一帧的基于帧间分类模式统计分类得到在各种宏块划分模式下不同的率失真开销值区间内宏块分布曲线,再根据大模式还是小模式下的宏块分布曲线按照本发明专利技术提出的4种不同方法计算当前帧的率失真阈值;在对当前帧每个宏块进行编码时,先计算16×16模式下的开销值;若该开销值小于所述阈值,则在大模式帧间分类下选择宏块划分模式;否则,在大、小两种模式下选择,都需选择最小开销值所对应的宏块划分模式作为所需选择的划分模式。本发明专利技术具有在基本保证视频质量的条件下,大大节省计算量的优点。

【技术实现步骤摘要】

本专利技术涉及信息处理的视频编码领域,主要针对H. 264视频国际编码标准中提出的帧间 多种块模式选择的方法,提出了新的利用了统计分类的方法选取阈值进行提前截止准则的快 速模式选择方法,在保证视频编码原有率失真的条件下,提高了编码速度。
技术介绍
视频压縮编码可以使视频数据量得到压縮,便于视频数据的存储和传输。由于不同的应 用对视频编解码器、视频数据存放格式、网络传输设备等都有不同的要求,国际标准化组织 制定了多种视频编码标准。如MPEG-2的制定使基于只读光盘的数字视频和数字电视成为可 能;MPEG-4等编码标准针对视频会议、可视电话等低比特率传输的需要而诞生;而H.264是 最新的视频压縮编码标准,它考虑了多媒体通信对视频编解码的各种要求。H. 264标准是由ITU-T的VCEG专家组和ISO/IEC的MPEG专家组共同成立的联合视频小 组(JVT)于2003年3月公布的。H.264也称MPEG-4的第10部分,即先进视频编码(AVC)。 H. 264在相同的PSNR下压縮率是MPEG-2的2倍左右,能够大大的节省带宽,并且具有良好的 网络接口等优越的性能,是当前最高效但也更加复杂的视频压縮方法。相信H.264编码标准 将具有越来越广泛的应用,并将取代MPEG-2等以前的编码标准,成为主流标准。视频序列相邻帧间有很强的时间相关性。 一般情况下,连续图像相邻帧的内容绝大部分 相同。如果传输或存储活动图像的时候,把每帧图像都完全传输或存储,将会耗费极大的网 络带宽和存储空间。利用运动估计和运动补偿技术可以有效的消除图像帧间冗余,从而实现 较高的压縮比。作为帧间压縮的核心和关键,运动估计技术受到人们的广泛关注,出现了多种研究方案, 其中块匹配运动估计算法由于算法简单高效、额外开销小等优点而被包括H. 264在内的绝大 多数视频编码标准所釆用。块匹配运动估计的基本思想是将图谬序列的每一帧分成许多互不重叠的宏块,并认为宏块内的所有像素的位移量都相同,然后对于当前帧中的每一个块在前一帧的一定搜索范围内 根据某一匹配准则找出与当前块最相似的块,即匹配块。由匹配块与当前块的相对位置计算 出运动位移,所得运动位移即为当前块的运动向量。利用搜索得到的运动向量在参考帧上进 行运动补偿,得到的残差值经离散余弦变换、量化、行程编码后与运动向量共同进行熵编码, 然后以比特流形式传出去。如果运动估计采用的搜索策略和匹配准则很有效的话,当前块和 最终匹配块的差别将很小,残差块大部分将为O或趋于O,从而降低残差的能量,有利于压 缩。H. 264的运动估计一般称为树状结构运动估计。 一个16x16的亮度宏块有4种划分和运 动估计方式 一个16x16宏块分割、两个16x8分割、两个8x16分割或四个8x8分割;每个 8x8的子宏块还可以分为 一个8x8的子宏块分割、两个8x4子分割、两个4x8子分割或四 个4x4子分割,如图1所示。在宏块内这些分割和子分割可以产生出大量的组合。每个分割 和子分割都需要一个单独的运动矢量。在码流内,每个运动矢量都需要被编码和传输并且分 割方式的选择也要被编码。 一个大尺寸的分割(16x16, 8x16, 16x8)只需要较少的比特来表示 运动矢量和分割种类的选择,但帧内包含高细节的区域的运动补偿参差就会很大。选择小的 分割会有较小的运动补偿参差,但要用大数目的比特表示运动矢量和分割种类。块匹配运动估计算法中依据各种准则函数衡量匹配的准确度,常用的匹配准则是绝对差 之禾口SAD(sums of absolute difference),定义如下5^D(/, 乂) = Z ZI A (m, ) — A—, O + z., +力Im=l m=1使用SAD准则不需要做乘法运算,实现简单,是最常用的匹配准则。本专利技术以下讨论和仿 真中,使用的H. 264的参考软件的衡量匹配的准则是基于SAD的率失真优化模型RD0(Rate Distortion Optimisation)准则。率失真优化模型计算宏块在每种划分模式下的率失真开销 人加cu. = + An。dJ,在本算法中'人。de代表率失真开销(rate distortioncost); &。^为拉 格朗日乘数;D表示前一帧原始宏块与其预测宏块之间的失真度;R为当前划分模式下编码该 宏块所需的实际比特数。在帧间预测时,宏块最终选取的划分模式为所有的模式中能使J目d。 最小的那一个。虽然众多宏块模式使得H.264能够取得很高的编码效率,但是直接导致了RDO 计算次数增多,这也增加了宏块模式决策的复杂性,代价就是更高的计算复杂度。所以帧间 模式选择问题一直是H. 264编码速度的一个瓶颈。近年出现的帧间模式选择方法有几种常用的思想,其中利用阈值提前截止的模式选择的 思想得到了非常广泛的应用,在只有较小性能损失的代价下,减小了计算复杂度。如有文献 提出如果发现16xl6模式已经适用,就直接跳过对16x8和8xl6的模式检査,否则全搜索;有文 献也利用了阈值提前截止判决的思想,算法设置了四级阈值7^7^7^^4,分别在不同的块 组计算代价,将代价值跟阈值相比较进行判断,这四个阈值的取法是^z'+^气i = 1, 2, 3, 4,其中义是由量化步长QP决定的,而在仿真中,该文为[al, a2, a3, a4]和[bl, b2 , b3 , b4 ]选择了固定值进行仿真,也就是说,唯一决定阈值变化的就是QP。该算法在 保持一定编码效率和视频质量的同时有更低的转码复杂度。然而以上方法都有一定的局限性。 比如,使用固定阈值,缺少普适性;虽然提出了可变的阈值,但是它的阈值只是随着QP变化 而变化的,并没有考虑到不同视频自身的特性等。由于不同视频序列特点不同,即使是同一 个视频序列内部的不同帧也有着不同的特点,而影响阈值的因素又较多。基于以上观点,发 明提出了一种基于统计分类方法的,不依赖于QP等参数的,利用自适应阈值对宏块模式进行 选择的方法。
技术实现思路
本专利技术的目的在于提出一种基于统计分类的H. 264宏块模式选择方法,本专利技术从相邻帧 间的相关性出发,结合模式分类的思想以及提前截止推出等方法利用自适应阈值进行帧间各 种块的模式选择
技术实现思路
如下由于对于一般的视频序列来说16x16预测模式使用率最高,并且其代价一定会首先经过 计算,所以可以建立16x16模式的RD0值人。de(16x16)(简称J16)和最终选择的模式之间的 关系,这是一个标准的模式分类问题。本专利技术的想法是,通过视频中相邻帧与帧之间的时间 相关性,通过前一帧的模式对应的J16分布情况,经过训练得到下一帧的阈值,从而对下一 帧的宏块模式进行选择。1.帧间模式分类首先将H. 264的多种帧间模式分为两类大模式BSM(Big Size Mode),包括16x16, 16x8, 8x16模式,和小模式SSM(Small Size Mode),包括8x8, 8x4, 4x8, 4x4。经过对一些通用 中间帧CIF格式的测试视频序列的统计可以发现, 一般情况下BSM的概率要大于SSM的概率 (见表l),又由上文所述,SSM比BSM的计算量更大,所以可以在BSM和SSM之间设置一个 阈值T,代表了对模式预测精度的本文档来自技高网
...

【技术保护点】
一种基于帧间模式统计分类的H.264宏块模式选择方法,其特征在于,该方法是在计算机中依次按照下面步骤实现的:步骤(1),针对设定的视频序列,在每一个连续帧开始编码时,计算前一帧的帧间划分模式所对应的各种宏块划分模式下不同的率失真开销值J↓[mode](16×16)在区间n↓[k]内宏块个数的分布曲线,再据此计算当前帧的率失真开销阈值T,其步骤如下:步骤(1.1),帧间模式的分类,把H.264的多种帧间模式分为两类:大模式BSM,包括16×16、16×8以及8×16三种宏块划分模式;小模式SSM,包括8×8、8×4、4×8以及4×4四种宏块划分模式;步骤(1.2),计算步骤(1.1)所述的前一帧内各种宏块划分模式下不同的率失真开销区间n↓[k]内宏块个数的分布,k=0,1,…63,n↓[k]=「k,k+1)对于大模式,区间n↓[k]内的宏块数N↓[BSM]为N↓[BSM](k)=*n↓[BSM]在小区间n↓[k]内判断有大模式的宏块时,n↓[BSM]=1;对于小模式,区间n↓[k]内的宏块数N↓[SSM]为N↓[SSM](k)=10×*n↓[SSM]在小区间n↓[k]内判断有小模式的宏块时,n↓[SSM]=1;J↓[mode](16×16)∈n↓[k]表示H.264帧间编码时16×16宏块划分模式下率失真开销值J↓[mode](16×16)在区间n↓[k]内;步骤(1.3),根据步骤(1.2)的结果,分别得到:帧间模式采用大模式时的各种宏块划分模式下的宏块个数在区间n↓[k]内的分布曲线,用BSM曲线表示;帧间模式采用小模式时的各种宏块划分模式下的宏块个数在区间n↓[k]内的分布曲线,用SSM曲线表示;所述宏块的率失真开销值J↓[mode]是使用H.264基于绝对值之和SAD的率失真优化模型而计算得到的:J↓[mode]=D+λ↓[mode]R,在本算法中,J↓[mode]代表率失真开销(ratedistortioncost);λ↓[mode]为拉格朗日乘数;D表示前一帧原始宏块与其预测宏块之间的失真度;R为当前划分模式下编码该宏块所需的实际比特数;步骤(1.4),根据步骤(1.3)得到的BSM和SSM曲线的曲线图,在其间选取一个合适的阈值T;步骤(2),开始对当前帧的每一个宏块进行编码,按步骤(1.3)所述的方法计算16×16模式下该宏块的率失真开销值J↓[mode](16×16);步骤(3),若步骤(2)所述...

【技术特征摘要】
1、一种基于帧间模式统计分类的H.264宏块模式选择方法,其特征在于,该方法是在计算机中依次按照下面步骤实现的步骤(1),针对设定的视频序列,在每一个连续帧开始编码时,计算前一帧的帧间划分模式所对应的各种宏块划分模式下不同的率失真开销值Jmode(16×16)在区间nk内宏块个数的分布曲线,再据此计算当前帧的率失真开销阈值T,其步骤如下步骤(1.1),帧间模式的分类,把H.264的多种帧间模式分为两类大模式BSM,包括16×16、16×以及8×16三种宏块划分模式;小模式SSM,包括8×8、8×4、4×8以及4×4四种宏块划分模式;步骤(1.2),计算步骤(1.1)所述的前一帧内各种宏块划分模式下不同的率失真开销区间nk内宏块个数的分布,k=0,1,…63,nk=[k,k+1)对于大模式,区间nk内的宏块数NBSM为2、 根据权利要求1所述的一种基于帧间模式统计分类的H. 264宏块模式选择方法,其特 征在于,所述步骤(1. 4)中按下述最小值阈值MVT法计算当前帧的帧间模式选择阈值取BSM曲线的最大值J16^M,取SSM曲线的最小值J16,,然后取两者之中较小的一个作为阈值,阈值计算公式为r緣7^M/JV(a,xMAY(J16顺),a2xM/A^/16窗)),其中,^,a2 e (O,l]为修正系数。3、 根据权利要求2所述的一种基于帧间模式统计分类的H.264宏块模式选择方法,其特 征在于,所述修正系数可取a, =l/2,a2 =3/4。4、 根据权利要求1所述的一种基于帧间模式统计分类的比264宏块模式选择方法,...

【专利技术属性】
技术研发人员:薛永林卢六翮赵康
申请(专利权)人:清华大学
类型:发明
国别省市:11[]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1