生成基于视频文件格式的形状识别列表的方法技术

技术编号：21606704 阅读：41 留言：0更新日期：2019-07-13 18:37

一种三维视频重构方法，编码器和解码器，包括从三维视频中获得对象的视频内容屏或视频内容帧的列表；获得所述三维视频的深度屏的列表；向所述三维视频的每个视频帧增加形状屏；将每一视频内容屏或视频内容帧和深度屏和形状屏相叠加形成形状标识库；将所述形状标识库存储于压缩文件的开头，用于于对象的解除遮蔽；形状识别列表格式能够通过标识替换原始形状来显著降低存储尺寸并提高压缩比，并有助于提高渲染质量。

A Method of Generating Shape Recognition List Based on Video File Format

全部详细技术资料下载

【技术实现步骤摘要】
生成基于视频文件格式的形状识别列表的方法
本专利技术涉及生成基于视频文件格式的形状识别列表的方法，特别是涉及生成基于用于存储和压缩立体或光场视频的视频文件格式的形状识别列表的方法。
技术介绍
目前大多数的视觉内容仍然是以图像序列形式存在的二维的图像或视频。随着显示技术的发展，现在可以广泛获得具有主动快门或被动式偏光眼镜的立体或三维(3D)显示。三维显示的输入通常有如下几种形式：(1)视频内容或视频纹理与描述视频内容中每个像素深度的深度图(即，2D+Z格式)；(2)以一定格式将临近视点的一套视频多路复用在一个图像帧上，临近视点的一套视频有时被称为多视角视频。基于传统2D+Z视频格式的多视图的重构质量高度依赖于深度图的质量。当深度图和视频纹理被压缩时，失真误差可能在两个文件中累积，并且这可能由于深度不连续性(例如，不同对象的不同边界)的未对准而引入伪像。现有技术存在一种伪影感知视图合成系统。它采用形状信息来提高多视图的重构质量。然而，它主要通过探索形状的冗余，直接压缩形状来处理形状的压缩。需要新的通过改善传统2D+Z格式视频重构质量的方法来改善基于2D+Z格式的立体视频。
技术实现思路
本专利技术提供一种生成基于视频文件格式的形状识别列表的方法，包括：从三维视频中获得对象的视频内容屏或视频内容帧的列表；获得所述三维视频的深度屏的列表；向所述三维视频的每个视频帧增加形状屏；将每一视频内容屏或视频内容帧和深度屏和形状屏相叠加形成形状标识库；将所述形状标识库存储于压缩文件的开头，用于对象的解除遮蔽。其中所述形状屏为形状信息标识，包括所述视频内容屏或所述视频内容帧的分类标...

【技术保护点】
1.一种三维视频重构方法，包括：从三维视频中获得对象的视频内容屏或视频内容帧的列表；获得所述三维视频的深度屏的列表；向所述三维视频的每个视频帧增加形状屏；将每一视频内容屏或视频内容帧和深度屏和形状屏相叠加形成形状标识库；将所述形状标识库存储于压缩文件的开头，用于对象的解除遮蔽。

【技术特征摘要】
1.一种三维视频重构方法，包括：从三维视频中获得对象的视频内容屏或视频内容帧的列表；获得所述三维视频的深度屏的列表；向所述三维视频的每个视频帧增加形状屏；将每一视频内容屏或视频内容帧和深度屏和形状屏相叠加形成形状标识库；将所述形状标识库存储于压缩文件的开头，用于对象的解除遮蔽。2.如权利要求1所述的方法，其中所述形状屏为形状信息标识，包括所述视频内容屏或所述视频内容帧的分类标识、对象识别标识和方向向量。3.如权利要求2所述的方法，其中所述形状信息标识还包括时间标识和坐标标识。4.如权利要求2－3所述的方法，其中所述形状信息标识由下面20位字节表示：CCNNNNVVVTTTTTTTTXYZ(1)其中CC代表为分类标识，用于将某一对象与其他对象相区别；NNNN为对象识别标识，同样的对象识别标识表示二者为同一对象；VVV为方向向量，其中每个字节由1，0，或－1来表示，分别表示对象的方向；TTTTTTTT为时间标识，可以以下列格式来表示时间：HH:MM:SS.ss；其中HH表示小时，MM表示分钟，SS表示秒，ss表示10毫秒的倍数；XYZ为三位字节的坐标标识，表示对象内的坐标。5.如权利要求1所述的方法，还包括：调用分类算法对每一帧分配分类标识(CC),对象标识(NNNN),方向向量(VVV)和位置XYZ；接收所述视频内容屏、深度屏和形状屏作为输入；以所述分类标识(CC),对象标识(NNNN),方向向量(VVV)和位置XYZ作为输出；通过训练数据样本训练将所述输入映射到所述输出的函数；并以数据库或形状库的形式存储所述训练数据样本。6.如权利要求5所述的方法，所述形状库使用一种包含分辨器所有可能的输出的文件集合的索引，利用所述索引来标记所述形状屏，相似的形状屏被分在相同的索引下。7.一种进行三维视频重构的编码器，包括：提取模块，利用聚类算法从完整视频的所有内容屏，形状屏和深度屏中发现并提取对象的视频内容帧、深度帧以及形状标识列表信息；叠加模块，将所述视频内容帧、深度帧以及形状标识列表信息相叠加；形状库生成模块，将所叠加的信息组合起来，构成形状识别列表视频文件格式，以生成形状库，并将所述形状库存储于压缩文件的头部，...

【专利技术属性】
技术研发人员：李应樵，陈增源，
申请(专利权)人：万维科研有限公司，
类型：发明
国别省市：中国香港,81

全部详细技术资料下载我是这个专利的主人