对球面视频数据进行编码制造技术

技术编号：22916656 阅读：48 留言：0更新日期：2019-12-24 22:25

描述了一种由编码器装置形成比特流的方法，该方法包括：该编码器装置的处理器接收包括一个或多个像素区域的经投影视频帧，该一个或多个像素区域表示投影到投影模型的一个或多个2D投影表面上的球面视频数据的像素，该投影模型适于将球面视频数据投影到视频帧的矩形2D表面上；该处理器在该接收到的经投影视频帧的基础上生成多个不同的候选视频帧，每个候选视频帧通过将至少一个操作应用于该经投影视频帧的一个或多个像素区域中的一个或多个像素组来形成，其中，所述至少操作包括移位、镜像和/或旋转操作；并且其中，对于所述多个不同的候选视频帧中的每一个，所述操作是不同的；该处理器将率失真分析应用于这些候选视频帧中的每一个，以确定这些候选视频帧中的每一个的率失真成本；以及该处理器在该率失真成本的基础上从所述多个候选视频帧中选择候选视频帧；以及在所选候选视频帧的基础上生成输出比特流。

Coding spherical video data

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】对球面视频数据进行编码
本专利技术涉及对球面视频数据进行编码，并且具体地，尽管非排他地，涉及用于对球面视频数据进行解码和编码的方法和系统、用于对经编码球面视频数据进行解码的解码器装置和用于对球面视频数据进行编码的编码器装置以及用于执行此类方法的计算机程序产品。
技术介绍
目前，越来越多的专业和消费级相机能够产生360度视频内容，也称为全向视频内容。可以被认为是布置在球面上的像素（有时也被称为像素球体或像素的球体）的此内容在下文被简称为术语球面内容。相比于常规视频，球面内容的递送通常需要更高的带宽。球面内容表示比常规视频更宽的视场，并且因此比常规视频包含更多来自原始场景的信息。然而，通常仅将球面内容的一部分显示给用户。此部分通常被称为视口，该视口以所谓的视场（FoV）为特征，即显示给用户的给定视觉场景的（竖直、水平或对角线）角范围。视口取决于用户正在观看的方向。然而，布置在球面上的像素无法由当前视频编码标准直接处理，该当前视频编码标准被配置成处理被称为视频帧的标准化视频数据格式，即像素的矩形布置，也被称为图片。因此，球面内容在被馈送至编码设备的输入之前被处理。针对球面视频内容的典型处理链可以包括用全景或360度图像捕获系统捕获全景图像。360视频的捕获通常包括多个图像传感器（例如，CMOS或CCD传感器）在不同方向捕获视频，并且然后在图像拼接操作中将来自各个图像传感器的单独图像拼接在一起以形成球面视频数据。此后，使用合适的投影模型将球面视频数据投影到2D矩形表面上。这样，形成了包括经投影球面图像数据的2...

【技术保护点】
1.一种由编码器装置形成比特流的方法，包括：/n该编码器装置的处理器接收经投影视频帧，该经投影视频帧具有包括一个或多个像素区域的像素区，该一个或多个像素区域，优选地多个像素区域具有表示投影到投影模型，优选地3D投影模型的一个或多个2D投影表面上的球面视频数据的像素，并且该一个或多个2D投影表面优选地以一对一的方式映射到所述一个或多个像素区域；/n随后，该处理器在该经投影视频帧的基础上生成多个不同的候选视频帧，每个候选视频帧通过将一个或多个像素操作应用于所述经投影视频帧的像素来生成，像素操作被定义为将移位、镜像和/或旋转操作中的至少一个应用于一个或多个像素组，每次生成所述多个不同的候选视频帧之一时，所述一个或多个像素操作中的至少一个是不同的；/n该处理器将率失真分析应用于这些候选视频帧中的每一个，以确定这些候选视频帧中的每一个的率失真成本；以及/n该处理器在该率失真成本的基础上从所述多个候选视频帧中选择候选视频帧，优选地，该候选视频帧的率失真成本在所述多个候选视频帧中是最低的；以及/n在所选候选视频帧的基础上生成输出比特流。/n

【技术特征摘要】
【国外来华专利技术】20170509 EP 17170049.51.一种由编码器装置形成比特流的方法，包括：
该编码器装置的处理器接收经投影视频帧，该经投影视频帧具有包括一个或多个像素区域的像素区，该一个或多个像素区域，优选地多个像素区域具有表示投影到投影模型，优选地3D投影模型的一个或多个2D投影表面上的球面视频数据的像素，并且该一个或多个2D投影表面优选地以一对一的方式映射到所述一个或多个像素区域；
随后，该处理器在该经投影视频帧的基础上生成多个不同的候选视频帧，每个候选视频帧通过将一个或多个像素操作应用于所述经投影视频帧的像素来生成，像素操作被定义为将移位、镜像和/或旋转操作中的至少一个应用于一个或多个像素组，每次生成所述多个不同的候选视频帧之一时，所述一个或多个像素操作中的至少一个是不同的；
该处理器将率失真分析应用于这些候选视频帧中的每一个，以确定这些候选视频帧中的每一个的率失真成本；以及
该处理器在该率失真成本的基础上从所述多个候选视频帧中选择候选视频帧，优选地，该候选视频帧的率失真成本在所述多个候选视频帧中是最低的；以及
在所选候选视频帧的基础上生成输出比特流。

2.根据权利要求1所述的方法，其中，该一个或多个像素组中的每一个限定该一个或多个像素区域之一内的像素，优选地一个像素组限定一个像素区域。

3.根据权利要求1所述的方法，其中，该一个或多个像素组中的每一个限定该一个或多个像素区域之一内的一个或多个编码块，优选地，至少一个像素区域包括整数个编码块；更优选地，编码块表示该处理器可以处理的最大像素块，优选地，HEVC型编码树块CTB、AVC型宏块、VP9或AV1超级块之一。

4.根据权利要求1至3中任一项所述的方法，其中，该多个候选视频帧的该生成进一步基于与该接收到的经投影视频帧相关联的元数据，优选地，该元数据包括关于以下各项中的至少一项的信息：该投影模型、该一个或多个像素区域的大小、该一个或多个像素区域在该经投影视频帧中的位置；和/或该一个或多个像素区域的几何形状。

5.根据权利要求1至4中任一项所述的方法，其中，该输出比特流的该生成包括：
确定解码器信息，该解码器信息包括用于使解码器装置能够反转被应用以生成所述所选候选视频帧的所述一个或多个像素操作的信息；以及
将所选候选帧以及任选地该解码器信息编码在比特序列中，优选地，该编码包括使用熵编码算法。

6.根据权利要求5所述的方法，其中，该解码器信息的至少一部分作为一个或多个SEI消息插入在该比特流中；和/或作为一个或多个网络抽象层NAL单元插入在该比特流中，优选地插入在该比特流中的一个或多个VCLNAL单元的头中。

7.根据权利要求1至6中任一项所述的方法，其中，该多个候选视频帧的该生成进一步基于该经投影视频帧中的该视频内容，优选地基于与该经投影视频帧中的该视频内容相关联的一个或多个图像分析参数，更优选地该一个或多个图像分析参数是在以下各项中的至少一项的基础上确定的：熵分析、显著分析、色移分析、运动幅度和/或运动方向分析、对象分析、色移分析、边界分析、边缘检测分析。

8.根据权利要求1至7中任一项所述的方法，其中，生成多个不同的候选视频帧包括：
在该接收到的经投影视频帧的基础上重构球面视频数据；
在图像分析算法的基础上选择多个旋转；
通过在旋转向量的基础上旋转该球面视频数据并将该经旋转球面视频数据投影到2D矩形平面上来生成该多个不同的候选视频帧。

9.根据权利要求1至8中任一项所述的方法，其中，在这些候选视频帧的该率失真分析期间，与该多个视频帧中的第一候选视频帧的率失真分析相关联的信息的至少一部分用于该多个视频帧中的第二候选视频帧的该率失真分析，优选地，该信息与该第一候选视频帧的类似于该第二候选视频帧的一个或多个相应像素布置的一个或多个像素布置相关联。

10.一种由解码器装置形成视频信号的方法，包括：
该解码器装置的处理器接收包括经投影视频帧的比特流，经投影视频帧具有包括一个或多个像素区域的像素区，该一个或多个像素区域具有表示投影到投影模型...

【专利技术属性】
技术研发人员：OA尼亚穆特，E托马斯，
申请(专利权)人：皇家KPN公司，荷兰应用自然科学研究组织，
类型：发明
国别省市：荷兰;NL

全部详细技术资料下载我是这个专利的主人