用于编码和解码三自由度和体积式兼容的视频流的方法和设备技术

技术编号：27440673 阅读：31 留言：0更新日期：2021-02-25 03:46

三维场景序列由编码器编码为视频，并传送到恢复该3D场景序列的解码器。3D场景中从确定的视点可见的点被编码为流的第一轨道中的颜色图像，以便可独立于流的其他轨道进行解码。颜色图像与三自由度渲染兼容。深度信息和场景中的剩余点的深度和颜色被编码在流的单独轨道中，并且仅在解码器被配置为解码该场景以用于体积式渲染的情况下被解码。于体积式渲染的情况下被解码。于体积式渲染的情况下被解码。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于编码和解码三自由度和体积式兼容的视频流的方法和设备

[0001]本公开涉及体积式(volumetric)视频内容的领域。本公开也在表示体积式内容的数据的格式化的背景下被理解，例如用于在诸如移动设备或头戴式显示器的终端用户设备上的沉浸式渲染。

技术介绍

[0002]该部分旨在向读者介绍本领域的各个方面，这些方面可能与本公开的下面描述和/或要求保护的各个方面相关。该讨论被认为有助于向读者提供背景信息，以便于更好地理解本专利技术的各个方面。因此，应当理解，要从这个角度来理解这些陈述，而不是将其理解为对现有技术的承认。
[0003]沉浸式视频(也称为360
°
平面视频)允许用户通过围绕静止视点旋转其头部来观看自己周围的一切。旋转仅允许3自由度(3DoF)体验。即使3DoF视频对于(例如使用头戴式显示设备(HMD)的)第一次全向视频体验来说是足够的，对于将期望更多自由(例如通过体验视差)的观看者来说，3DoF视频也可能很快变得令人沮丧。此外，3DoF还可能引起眩晕，因为用户从不仅仅旋转其头部，还会在三个方向上平移(translate)其头部，这种平移不在3DoF视频体验中再现。
[0004]体积式视频(也称为6自由度(6DoF)视频)是3DoF视频的替代方案。当观看6DoF视频时，除旋转外，用户还可以在观看的内容内平移其头部乃至其身体，并体验视差甚至体积。这种视频大大增加了沉浸感和对场景深度的感知，并且还通过在头部平移期间提供一致的视觉反馈来防止眩晕。内容由允许同时记录感兴趣场景的颜色和深...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种生成表示3D场景的流的方法，所述方法包括：-通过根据第一投影映射将所述3D场景中的从视点可见的点投影到第一颜色图上来生成第一颜色数据，所述第一颜色数据是适于使能围绕所述视点的3自由度的旋转的渲染的颜色图像；-通过根据第二投影映射将所述3D场景中的从所述视点可见的点投影到第一深度图上来生成第一深度数据；所述第一深度数据被编码为打包在与第一补丁数据项列表相关联的第一深度补丁图谱中的补丁图片，第一补丁数据项包括将深度补丁图片与所述颜色图像的像素区域进行映射的信息；-生成表示所述3D场景中的从所述视点不可见的点的第二颜色数据和第二深度数据；以及-在所述流中，将所述第一颜色数据编码在第一语法元素中，并将所述第一深度数据、所述第二颜色数据和所述第二深度数据编码在至少第二语法元素中。2.根据权利要求1所述的方法，其中所述3D场景是以多视图加深度(MVD)帧的形式获得的，并且其中通过移除所述MVD帧的视图中的、与所述3D场景中从所述视点可见的点相关联的像素，来执行生成第二颜色数据和第二深度数据。3.根据权利要求1所述的方法，其中通过根据第三投影映射将所述3D场景中的剩余点投影到第二颜色图和第二深度图上，来执行生成第二颜色数据和第二深度数据，所述剩余点是所述3D场景中的从所述视点不可见的点。4.根据权利要求3所述的方法，其中所述第二颜色数据被编码为打包在颜色补丁图谱中的补丁图片，并且其中所述第二深度数据被编码为第二深度补丁图谱中的补丁图片并与第二补丁数据项列表相关联，第二补丁数据项包括将深度补丁图片与所述第二补丁图谱的颜色补丁进行映射的信息。5.一种用于将表示3D场景的数据编码到流中的设备，所述设备包括存储器，所述存储器至少与被配置为执行以下操作的处理器相关联：-通过根据第一投影映射将所述3D场景中的从视点可见的点投影到第一颜色图上来生成第一颜色数据，所述第一颜色数据是与使能围绕所述视点的3自由度的旋转的渲染兼容的颜色图像；-通过根据所述第二投影映射将所述3D场景中的从所述视点可见的点投影到第一深度图上来生成第一深度数据；所述第一深度数据被编码为打包在与第一补丁数据项列表相关联的第一深度补丁图谱中的补丁图片，第一补丁数据项包括将深度补丁图片与所述颜色图像的像素区域进行映射的信息；-生成表示点的第二颜色数据和第二深度数据，所述点是所述3D场景中的从所述视点不可见的点；以及-在所述流中，将所述第一颜色数据编码在第一语法元素中，并将所述第一深度数据、所述第二颜色数据和所述第二深度数据编码在至少第二语法元素中。6.根据权利要求5所述的设备，其中所述3D场景是以多视图加深度(MVD)帧的形式获得的，并且其中通过移除所述MVD帧的视图中的、与所述3D场景中从所述视点可见的点相关联的像素，来执行生成第二颜色数据和第二深度数据。7.根据权利要求5所述的设备，其中通过根据第三投影映射将所述3D场景中的剩余点
投影到第二颜色图和第二深度图上，来执行生成第二颜色数据和第二深度数据，所述剩余点是所述3D场景中的从所述视点不可见的点。8.根据权利要求7所述的设备，其中所述第二颜色数据被编码为打包在颜色补丁图谱中的补丁图片，并且其中所述第二深度数据被编码为第二深度补丁图谱中的补丁图片并与第二补丁数据项列表相关联，第二补丁数据项包括将深度补丁图片与所述第二补丁图谱的颜色补丁进行映射的信息。9.一种解码3D场景的方法，所述方法包括：-获得流，所述流包括：
·
第一语法元素，其携带表示所述3D场景的第一颜色数据，所述第一颜色数据是通过根据第一投影映射对所述3D场景中的从视点可见的...

【专利技术属性】
技术研发人员：J弗勒罗，B丘波，G布里安德，R多尔，T塔皮，F图多，
申请(专利权)人：交互数字VC控股公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人