一种基于边缘检测的3D-HEVC深度图帧内编码模式快速决策方法技术

技术编号:20801397 阅读:30 留言:0更新日期:2019-04-06 15:15
本发明专利技术公开了一种基于边缘检测的3D‑HEVC深度图帧内编码模式快速决策方法,本方法通过判断当前预测单元属于平坦区域还是纹理复杂区域来简化帧内模式选择过程。若满足平坦区域条件,则跳过相应帧内预测模式;否则,通过检测边缘的方向来减少粗模式选择(RMD)中角度模式计算数量,从而降低帧内编码复杂度,减少编码时间。对比实验结果证明了本算法的有效性,与标准测试平台HTM 16.0相比,本方法在保证视频编码质量基本不变的前提下,可以节省30.61%的编码时间,有效降低了视频帧内编码的复杂度。

A Fast Decision Method for Intra-frame Coding Mode of 3D-HEVC Depth Map Based on Edge Detection

The invention discloses a fast decision-making method for intra-coding mode of 3D HEVC depth map based on edge detection. The method simplifies the intra-mode selection process by judging whether the current prediction unit belongs to a flat area or a texture complex area. If the flat area condition is satisfied, the corresponding intra prediction mode is skipped; otherwise, the computation amount of angle mode in rough mode selection (RMD) is reduced by detecting the direction of the edge, which reduces the intra coding complexity and coding time. Compared with HTM 16.0, the proposed method can save 30.61% coding time and reduce the complexity of intra-frame coding effectively, while guaranteeing the same quality of video coding.

【技术实现步骤摘要】
一种基于边缘检测的3D-HEVC深度图帧内编码模式快速决策方法
本专利技术涉及基于3D-HEVC的视频编码技术,具体涉及一种3D-HEVC编码中基于边缘检测的深度图帧内编码模式快速决策方法
技术介绍
随着计算机多媒体技术的兴起,电影、电视等方面的视频技术不断发展和完善,数字视频技术已经成为现代学术界和工业界的研究热点。三维视频不仅给人们感官上带来更高的体验感,而且也具有较为广泛的应用前景,如医学、教育等领域。为了满足各方面应用在视频压缩和传输等方面的需求,众多国内外学者和研究机构在3D视频高效编码方面开展了大量的科学研究。截止目前,正式颁布的最新3D视频编码标准是基于新一代高效视频编码标准(HighEfficiencyVideoCoding,HEVC)的3D-HEVC标准。3D-HEVC编码标准采用多视点视频加深度(Multi-viewVideoPlusDepth,MVD)的视频格式。这种视频格式只需编码少量视点的视频,并在视频的解码端利用基于深度的图像绘制(Depth-image-basedRendering,DIBR)技术来合成相邻视点间的虚拟视点。这样就可以利用较少的已编码视点来获得更多数量的虚拟视点,从而有效提高视频的压缩和传输效率。进行编码的每个视点均为同一时间从不同角度对同一场景进行拍摄得到的,包含纹理图和深度图。如图1所示,(a)为纹理图,(b)为相应视点的深度图,其像素值表示物体到摄像机的量化距离。通过观察可知,纹理图含有较多的纹理细节,而深度图则存在锐利边缘(实线框所示)和大片平坦区域(虚线框所示)。3D-HEVC标准针对于深度视频边缘信息丰富的特征,在保留原有的35中帧内编码模式以外,引入了新的帧内编码技术——深度模型模式(DepthModelingMode,DMM),该模式包括楔形(Wedgelet)模式和轮廓(Contour)模式。该新技术在提升视频质量的同时也使帧内编码复杂度急剧增加。表1给出了传统的35种帧内预测模式以及3D-HEVC深度图帧内编码时引入的两种DMM预测模式的编号,模式0为Planar模式,模式1为DC模式,模式2~34为33种角度模式,模式37、38分别为DMM1(Wedgelet)模式和DMM4(Contour)模式。传统的35种预测模式方向如图2所示,其中模式2~17称为水平类模式,模式18~34称为垂直类模式。Planar模式适用于像素值缓慢变化的区域,DC模式适用于大面积平坦区域,因此这两种模式在平坦区域被选择的概率较大;而角度模式则是为了能更好的适应视频内容中不同的纹理方向,因此在纹理复杂的区域应用的概率较大。传统的帧内编码方法,存在计算复杂度高,编码效率低的问题。本专利技术针对于具有较高计算复杂度的深度图帧内编码过程,提出了一种基于边缘检测的帧内编码快速决策方法,在保证视频质量的同时,有效减少帧内预测编码过程的计算复杂度,提高编码效率。表13D-HEVC帧内预测模式帧内模式编号帧内模式名称0Planar模式1DC模式2~3433种角度模式37DMM1(Wedgelet)模式38DMM4(Contour)模式在帧内预测编码过程中,对于每一个预测单元(PU),均使用粗模式选择(RoughModeDecision,RMD)和率失真优化(RateDistortionOptimation,RDO)相结合的过程,最终选择出最佳的帧内预测模式,具体过程如图3所示。首先进行粗模式选择,利用基于Hadamard变换得到的绝对变换差的和(SumofAbsoluteTransformDifferences,SATD),计算35种帧内预测模式的低复杂度率失真代价值,并将其从小到大排序后,选择前N种(8×8和4×4尺寸的PU为8种,16×16、32×32和64×64尺寸的PU为3种)代价值最小的模式加入到候选列表中[8]。然后,将最有可能的模式(mostprobablemodes,MPMs)加入到候选列表中。当编码深度图时,由于深度模型模式被设计为帧内预测模式,因此DMM1和DMM4也被加入到最终的率失真优化候选列表中;而编码纹理图时,则跳过DMM模式选择过程。最后,对候选列表中的所有模式进行率失真优化计算,得到更加精确的率失真代价函数,并通过比较率失真代价值选择出代价值最小的模式作为当前PU的最佳帧内预测模式。
技术实现思路
本专利技术的目的在于,针对基于HEVC的3D视频编码标准3D-HEVC中深度图帧内编码过程计算复杂度高的问题,提出了一种基于边缘检测的深度图帧内模式快速决策方法,在保证视频成虚拟视点质量的前提下,有效降低编码复杂度,提高编码效率,缩短编码时间。为解决上述技术问题,本专利技术采取的技术方案为:一种基于边缘检测的3D-HEVC深度图帧内编码模式快速度选择方法,该方法通过判断当前预测单元(PredictionUnit,PU)属于平坦区域还是纹理复杂区域来简化帧内模式选择过程。若满足平坦区域条件,则跳过相应帧内预测模式;否则,通过检测边缘的方向来减少粗模式选择(RoughModeDecision,RMD)中角度模式计算数量,从而降低帧内编码复杂度,减少编码时间。本专利技术的技术方案流程如图所示。本方法包含如下步骤:S1判断当前PU是否属于为深度图,如为深度图继续进行步骤1.2,若为纹理图则进行35种帧内预测模式的粗模式选择过程,并跳转到步骤1.3;S2、提取深度图的灰度值,并利用边缘检测的方法判断当前PU的纹理特征,确定帧内编码候选模式:S2.1:对于PU的各个像素点,将水平、垂直、45度和135度角方向的各向同性Sobel算子模板与其覆盖的图像3×3区域的9个像素进行卷积计算后,可得到该像素点的4个方向的边缘梯度分量G0,G45,G90和G135。4个方向的各向同性Sobel算子模板如图4所示。4个方向的边缘梯度计算公式为:G0,G45,G90和G135分别为当前编码单元PU中各像素点水平、45度角、垂直、和135度角方向的边缘梯度分量,p为像素点的亮度值;S2.2:计算各个方向的边缘梯度后,利用公式:计算当前像素的总梯度值。G为当前编码单元PU中各像素点的边缘梯度值。S2.3:得到PU中每个像素的总梯度值后,利用公式:计算当前PU的纹理复杂度。W为当前预测单元PU的宽度,Gi为边缘梯度值矩阵中第i个像素点的梯度幅值,T为当前PU的纹理复杂度。S2.4:若T=0,则跳过粗模式选择过程,直接将Planar、DC模式加到帧内模式候选列表中;S2.5:若T≠0,计算在当前PU中每个像素的边缘梯度分量G0,G45,G90和G135分别为最大值的次数,记为D0,D45,D90和D135。S2.6:根据公式:MAIND=max{D0,D45,D90,D135},选择D0,D45,D90和D135中最大值所代表的方向为当前PU的纹理预测方向,并根据表2选择相应的帧内预测模式范围,并对相应模式进行粗模式选择计算。D0,D45,D90,D135分别表示当前PU中每个边缘梯度(G0,G45,G90,G135)为最大值的次数,MAIND为D0,D45,D90,D135中的最大值,即当前PU的纹理预测方向。表2纹理预测方向对应的帧内预测模式纹理预测方向帧内预测模式D00,1,21-31本文档来自技高网
...

【技术保护点】
1.一种基于边缘检测的3D‑HEVC深度图帧内编码模式快速决策方法,其特征在于:本方法包含如下步骤:S1判断当前PU是否属于为深度图,如为深度图继续进行步骤1.2,若为纹理图则进行35种帧内预测模式的粗模式选择过程,并跳转到步骤1.3;S2、提取深度图的灰度值,并利用边缘检测的方法判断当前PU的纹理特征,确定帧内编码候选模式:S2.1:对于PU的各个像素点,将水平、垂直、45度和135度角方向的各向同性Sobel算子模板与其覆盖的图像3×3区域的9个像素进行卷积计算后,得到该像素点的4个方向的边缘梯度分量G0,G45,G90和G135;4个方向的各向同性Sobel算子模板如图4所示;4个方向的边缘梯度计算公式为:

【技术特征摘要】
1.一种基于边缘检测的3D-HEVC深度图帧内编码模式快速决策方法,其特征在于:本方法包含如下步骤:S1判断当前PU是否属于为深度图,如为深度图继续进行步骤1.2,若为纹理图则进行35种帧内预测模式的粗模式选择过程,并跳转到步骤1.3;S2、提取深度图的灰度值,并利用边缘检测的方法判断当前PU的纹理特征,确定帧内编码候选模式:S2.1:对于PU的各个像素点,将水平、垂直、45度和135度角方向的各向同性Sobel算子模板与其覆盖的图像3×3区域的9个像素进行卷积计算后,得到该像素点的4个方向的边缘梯度分量G0,G45,G90和G135;4个方向的各向同性Sobel算子模板如图4所示;4个方向的边缘梯度计算公式为:G0,G45,G90和G135分别为当前编码单元PU中各像素点水平、45度角、垂直、和135度角方向的边缘梯度分量,p为像素点的亮度值;S2.2:计算各个方向的边缘梯度后,利用公式:计算当前像素的总梯度值;G为当前编码单元PU中各像素点的边缘梯度值;S2.3:得到PU中每个像素的总梯度值后,利用公式:计算当前PU的纹理复杂度;W为当前预测单元...

【专利技术属性】
技术研发人员:贾克斌张儒依刘鹏宇孙中华
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1