一种基于子范围编码深度查询表的方法技术

技术编号:12267713 阅读:97 留言:0更新日期:2015-10-31 14:44
本发明专利技术涉及一种基于子范围编码深度查询表(300)的方法(200),所述深度查询表包括3D视频序列的深度值,所述深度值限制在某一范围(301)内;所述方法包括:201、将所述范围(301)划分成多个子范围,其中,第一子范围(303)包含第一组深度值,第二子范围(305)包含第二组深度值;203、将所述深度查询表(300)的每个所述子范围的深度值分别根据预定编码规则进行编码。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种深度查询表(DLT)的编码方法和装置以及一种深度查询表的解 码方法和装置,特别是在计算机视觉领域,尤其是在3D视频处理和3D视频编码领域。
技术介绍
在3D视频中,深度数据通常表示为与每个纹理视频帧对应的一组深度图像。深度 图像每个点的清晰度描述了从该点所表示的视觉场景到摄像头的距离。或者,可以使用视 差图,其取值与深度图像的取值成反比,并且可用来提取深度图像。 在3D视频编码中,除常规的视频数据之外,每个视角的深度图像都需要编码。相 比视频数据,这些深度图像显示不同信号特征,因为它们包含由坚固的边缘界定的分段光 滑区域。由于深度图像经常从纹理数据中估计得来或者进行了预处理,它们的柱状图可能 会较稀疏。因此,在【F.Jiiger"3D-CE6.h:关于一种可选深度查询表的简化深度编码的结 果",联合协作小组于2012年在中国上海关于ITU-TVCEG和IS0/IECMPEG的3D视频编码 扩展开发(JCT-3V)的文档JCT3V-B0036】中提出了深度查询表(DLT),从而仅通过发送DLT 的差分指数,而不是通过发送残差深度值本身来体现柱状图特征。通过这种方法,可以降低 这些残差值的位深度,因此提高了编码效率。 通过分析原始的、未解压的深度图像的柱状图在编码器构造DLT。然后将该DLT传 输到解码器,以实现索引到实际深度值的映射。深度图像的柱状图值可能会随时间而变,因 此需要一个更新机制。其次,在多视图编码场景下,多个深度图像可以有不同的深度图像柱 状图,在这些情况下,此类更新机制也有利于整体编码性能。 在高效视频编码3D扩展的最新规范【G.Tech,K.Wegner,Y.Chen和S.Yea的 "3D-HEVC测试模型2",2012年10月联合协作小组关于3D视频编码扩展开发的文档 JCT3V-B1005】中,序列参数集(SPS)中的每个序列,DLT只发送一次,独自用于所有视图。 该方法使发送DLT的开销保持在较低的水平。 也提出了在基本视图的每个I切片的切片头中发送DLT【I.Lim,H.C.Wey和 D.S.Park"3D-CE6.h相关的:改进的深度查询表(DLT) ",联合协作小组于2013年在瑞 士日内瓦的关于ITU-TVCEG和IS0/IECMPEG的3D视频编码扩展开发(JCT-3V)的文档 JCT3V-C0093】。在该方法中,DLT值更有规律地按时间方向更新,从而实现了柱状图随时间 而变。在这种情况下,假设在每个视图的深度图像柱状图都一样,则所有辅助视图都继承了 基本视图的DLT。 此外,另一种发送DLT值的方法,称为图1中所描述的区域约束位图(RCBM)编码 100,在【张凯,安吉城,雷晓明"3D-CE6.h相关的:3DVC中一种DLT的有效编码方法",2013 年1月联合协作小组关于3D视频编码扩展开发的文档JCT3V-C0142】中提出。所述方法100 发送存在于DLT中(参见图1)的深度值的范围:min_dlt_value和diff_max_dlt_value 编码为无符号整数来限制DLT的取值范围。DLT中的最小值是min_dlt_value,最大值是 MaxDltValue,该值等于min_dlt_value+diff_max_dlt_value。然后,二进制串bit_map_ flag用于发送范围内的深度值是否存在于DLT。如果bit_map_flag中的一个比特位等于 1,对应二进制串中该位置的深度值属于或者出现在DLT中,否则,该深度值不属于或者未 出现在DLT中。 现有技术中的DLT发送的编码方法没有充分利用该信号的特征,因此,有必要进 一步提高DLT的编码效率。
技术实现思路
本专利技术的目的在于为深度查询表提供一种改进的编码/解码技术。 该目的是通过独立权利要求的特征实现的。结合从属权利要求、说明书和附图会 使【具体实施方式】更易于理解。 本专利技术基于以下发现结果:用于深度查询表的一种改进的编码/解码技术可以通 过使用多范围DLT表现形式来提供。不是在当前DLT中将所有值以一个范围发送,而是将这 些值的原始范围划分成多个子范围,例如,分成两个或更多子范围,且发送每个子范围。更 近一步,提出了多范围DTL表现形式的变体,确定自适应选择使用单范围还是多范围DTL表 现形式,并使用单个标志发送已选择的表现形式。 提出了深度查询表编码/解码的新技术,其降低了DLT编码所需要的比特率。由 于不同序列之间甚至相同序列内(帧间和视图间)的深度图像特征可能会明显不同,这项 技术为编码/解码DLT提供了高度灵活性。 为了利用DLT查询表的特征,所提出的技术介绍了一种在诸如区域约束位图 (RCBM)现有方案中使用的二进制串等基于范围的表现形式之外使用所发送DLT值的多范 围DLT表现形式进行DLT编码/解码的新方法。不是只发送DLT值的一个范围,而是将需 要为DLT发送的值的整个范围划分成多个,例如两个或更多的子范围。 本专利技术基于以下进一步的发现结果:用于深度查询表的一种改进的编码/解码技 术可以通过额外的DLT间或DLT预测来提供。不是直接划分当前DLT的范围,而是将当前 DLT的差分DLT的范围划分成多个子范围,该范围只包括当前DLT和参考DLT间的差异。因 为当前DLT和参考DLT间具有相似性,差分DLT通常很稀疏且显示出更大的差距。在使用 多范围DLT编码时,这带来进一步的编码增益。 为详细描述本专利技术,将使用以下术语、缩写和符号: HEVC-高效视频编码 CU-编码单兀 DLT-深度查询表 RAP-随机接入点 SEI-补充增强信息 SH-切片头 SPS-序列参数集 PPS-图像参数集 视频序列一组呈现动态图像的后续帧。 3D视频包含两个纹理视图及其对应深度图像或视差图的信号。 视觉场景3D视频中表现的真实世界或合成场景。 深度图像灰阶图像,该图像每个点的值决定该点表示的视觉场景到摄像头的距 离。或者,可以使用视差图来表示或提取深度图像,其取值与深度图像的取值成反比。 纹理视图在指定视角获取的视频,其包括视觉场景的颜色和纹理信息,通常以 RGB或YUV格式表示。 随机接入点定义为视频序列结构中的点,从该点起解码器能够在不知道视频流 前面部分内容的情况下开始解码该序列。 SPS-组以有条理的消息形式发送的参数,所述消息包括正确解码视频流所需要 的基本信息,且必须在每个随机接入点的最开始发送。 PPS-组以有条理的消息形式发送的参数,所述消息包括在视频序列中正确解码 图像所需要的基本信息。 图像视频序列的结构,其包括视频序列的整个图像,也称为帧。 切片视频序列的结构,其包括视频序列整个图像的一部分。 切片头一组描述切片的参数,在切片最开始发送。 ⑶预定义大小的视频序列的基本编码结构,其包括图像的一部分(例如,64x64 个像素点)。 I切片所有编码单元都是在内部预测,因此不允许参考其他图像的切片。 SEI能够以视频序列流方式发送的消息,其包括视频序列、编码工具等相关的额 外或可选信息。 第一方面,本专利技术涉及,所述深度查询表 包括3D视频序列的深度值,所述深度值限制在某一范围内;所述方法包括:将所述范围划 分成多个子范围,其中,第一子范围本文档来自技高网
...

【技术保护点】
一种基于子范围编码深度查询表(300)的方法(200),所述深度查询表包括至少一部分3D视频序列的深度值,所述深度值限制在某一范围(301)内;所述方法包括:201、将所述范围(301)划分成多个子范围,其中,第一子范围(303)包含第一组深度值,第二子范围(305)包含第二组深度值;203、将所述深度查询表(300)的每个所述子范围的深度值分别根据预定编码规则进行编码。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:亚采克·科涅奇费边·耶格尔麦蒂尔斯·韦恩
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1