基于全景的3D视频译码制造技术

技术编号：11024244 阅读：66 留言：0更新日期：2015-02-11 12:50

描述了包括对于基于全景的3D视频译码的操作的系统、设备、物品，以及方法。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于全景的3D视频译码背景视频编码器压缩视频信息，以便可以通过给定带宽发送更多信息。然后，可以将压缩信号传输到接收器，该接收器在显示之前解码或解压缩信号。3D视频已经变为可以比传统的2D视频提供更丰富的视觉体验的新兴的媒体。潜在的应用包括自由视点视频(FVV)、自由视点电视(FTV)、3D电视(3DTV)、IMAX电影院、沉浸式电话会议，监测等等。为支持这些应用，视频系统通常从不同的视点捕捉场景，这会导致同时从不同的相机生成多个视频序列。3D视频译码(3DVC)是指以服务于各种3D显示器为目标的新视频压缩标准。3DVC正在由IS0/IEC运动图像专家组(MPEG)开发。目前，基于最新的常规视频译码标准——高效率视频译码(High Efficient Video Coding:HEVC),来构建3DVC的一个分支,计划在2012年末之前完成。3DVC的其他分支基于H.264/AVC构建。IS0/IEC运动图像专家组(MPEG)现在进行3D视频译码(3DVC)的标准化。新3DVC标准可能允许从有限量的输入数据生成许多高质量视图。例如，可以使用多视图视频加深度(Multiview Video plus Depth:MVD)概念来从有限量的输入数据生成这样的高质量视图。进一步地，可以使用3DVC来用于高级立体处理功能，并用来支持自动立体显示器和FTV,自动立体显示器和FTV允许用户具有3D视觉体验，同时在3D显示器前面自由地改变他们的位置。一般而言，多视图视频加深度(MVD)概念有支持FTV功能，多视图视频以及相关联的深度图信息的两个主要组件。这样的多视图视频通常是...

【技术保护点】
一种用于视频译码的计算机实现的方法，包括：通过2D解码器解码全景视频和相关联的全景地图，其中所述全景视频和所述相关联的全景地图是至少部分地基于多个纹理视图和相机参数生成的；以及至少部分地基于所述全景视频和所述相关联的全景地图来提取3D视频。

【技术特征摘要】
【国外来华专利技术】1.一种用于视频译码的计算机实现的方法，包括: 通过20解码器解码全景视频和相关联的全景地图，其中所述全景视频和所述相关联的全景地图是至少部分地基于多个纹理视图和相机参数生成的；以及至少部分地基于所述全景视频和所述相关联的全景地图来提取30视频。2.如权利要求1所述的方法，其特征在于，对所述30视频的所述提取还包括: 至少部分地基于所述相关联的全景地图，通过30卷曲技术，将所述全景视频的所述目标区域卷曲到输出纹理视图；至少部分地基于所述输出纹理视图来确定所述30视频的左视图和右视图；以及至少部分地基于所确定的左视图和右视图，以所述用户视图偏好，显示所述30视频。3.如权利要求1所述的方法，其特征在于，对所述30视频的所述提取还包括: 至少部分地基于所述相关联的全景地图，通过30卷曲技术，将所述全景视频的所述目标区域卷曲到输出纹理视图；以及至少部分地基于所述输出纹理视图，执行其他全景视频的画面间预测。4.如权利要求1所述的方法，其特征在于，对所述30视频的所述提取还包括: 接收用户输入；至少部分地基于所述用户输入，确定所述全景视频的任何任意目标视图以及相关联的目标区域处的用户视图偏好；至少部分地基于所述用户视图偏好，设置虚拟相机；以及至少部分地基于所述虚拟相机的相机参数以及所述相关联的全景地图，通过30卷曲技术，将所述全景视频的所述目标区域卷曲到输出纹理视图。5.如权利要求1所述的方法，其特征在于，对所述30视频的所述提取还包括: 接收用户输入；至少部分地基于所述用户输入，确定所述全景视频的任何任意目标视图以及相关联的目标区域处的用户视图偏好，其中能通过下列准则中的一个或多个来定义所述用户视图偏好:目标视图的视图方向、视点位置，以及视场；至少部分地基于下列准则中的一个或多个上的预知配置，设置虚拟相机:视点位置、视场，以及所述全景视频中的确定的视图范围；以及至少部分地基于所述虚拟相机的相机参数以及所述相关联的全景地图，通过30卷曲技术，将所述全景视频的所述目标区域卷曲到输出纹理视图。6.如权利要求1所述的方法，其特征在于，对所述30视频的所述提取还包括: 对于所述全景视频，执行视图混合。7.如权利要求1所述的方法，其特征在于，对所述30视频的所述提取还包括: 接收用户输入；至少部分地基于所述用户输入，确定所述全景视频的任何任意目标视图以及相关联的目标区域处的用户视图偏好，其中能通过下列准则中的一个或多个来定义所述用户视图偏好:目标视图的视图方向、视点位置，以及视场；至少部分地基于下列准则中的一个或多个上的预知配置，设置虚拟相机:视点位置、视场，以及所述全景视频中的确定的视图范围；当所述目标区域来自多于单个纹理视图时，对于所述全景视频的所述目标区域，执行视图混合，其中在卷曲之前或在编码之前，发生所述视图混合；至少部分地基于所述虚拟相机的相机参数以及所述相关联的全景地图，通过30卷曲技术，将所述全景视频的所述目标区域卷曲到输出纹理视图；至少部分地基于所述输出纹理视图来确定所述30视频的左视图和右视图；至少部分地基于所确定的左视图和右视图，以所述用户视图偏好，显示所述30视频；以及至少部分地基于所述输出纹理视图，执行其他全景视频的画面间预测。8.如权利要求1所述的方法，其特征在于，所述全景视频以及所述相关联的全景地图的生成包括: 通过图像拼接算法，从所述多个纹理视图，生成所述全景视频；以及生成能够在所述多个纹理视图和所述全景视频之间映射像素坐标的所述相关联的全景地图，作为从所述多个纹理视图到所述全景图像的透视投影。9.如权利要求1所述的方法，其特征在于，所述全景视频以及所述相关联的全景地图的生成包括: 至少部分地基于所确定的投影矩阵和所确定的像素对应关系，通过图像拼接算法，从所述多个纹理视图，生成所述全景视频；生成能够在所述多个纹理视图和所述全景视频之间映射像素坐标的所述相关联的全景地图，作为从所述多个纹理视图到所述全景图像的透视投影；以及编码所述全景视频和所述相关联的全景地图。10.如权利要求1所述的方法，其特征在于，所述全景视频以及所述相关联的全景地图的生成包括: 确定能够通过关键点特征从所述多个纹理视图映射像素坐标的像素对应关系；至少部分地基于所述相机外部参数和相机内部参数，确定投影矩阵；至少部分地基于从所确定的投影矩阵和/或所确定的像素对应关系的几何映射，通过图像拼接算法，从所述多个纹理视图，生成所述全景视频；生成能够在所述多个纹理视图和所述全景视频之间映射像素坐标的所述相关联的全景地图，作为从所述多个纹理视图到所述全景图像的透视投影；以及编码所述全景视频和所述相关联的全景地图。11.如权利要求1所述的方法，其特征在于，所述全景视频以及所述相关联的全景地图的生成包括: 确定能够通过关键点特征从所述多个纹理视图映射像素坐标的像素对应关系；估计相机外部参数，其中所述相机外部参数包括下列各项中的一个或多个:多个相机之间的平移矢量和旋转矩阵；至少部分地基于所述相机外部参数和相机内部参数来确定投影矩阵；至少部分地基于从所确定的投影矩阵和/或所确定的像素对应关系的几何映射，通过图像拼接算法，从所述多个纹理视图，生成所述全景视频；生成能够在所述多个纹理视图和所述全景视频之间映射像素坐标的所述相关联的全景地图，作为从所述多个纹理视图到所述全景图像的透视投影；以及编码所述全景视频和所述相关联的全景地图。12.如权利要求1所述的方法，其特征在于，进一步包括: 在20编码器侧: 确定能够通过关键点特征从所述多个纹理视图映射像素坐标的像素对应关系；估计相机外部参数，其中所述相机外部参数包括下列各项中的一个或多个:多个相机之间的平移矢量和旋转矩阵；至少部分地基于所述相机外部参数和相机内部参数来确定投影矩阵；至少部分地基于从所确定的投影矩阵和/或所确定的像素对应关系的几何映射，通过图像拼接算法，从所述多个纹理视图，生成所述全景视频；生成能够在所述多个纹理视图和所述全景视频之间映射像素坐标的所述相关联的全景地图，作为从所述多个纹理视图到所述全景图像的透视投影；编码所述全景视频和所述相关联的全景地图；在所述20解码器侧，所述30视频的所述提取还包括: 接收用户输入；至少部分地基于所述用户输入，确定所述全景视频的任何任意目标视图以及相关联的目标区域处的用户视图偏好，其中能通过下列准则中的一个或多个来定义所述用户视图偏好:目标视图的视图方向、视点位置，以及视场；至少部分地基于下列准则中的一个或多个上的预知配置，设置虚拟相机:视点位置、视场，以及所述全景视频中的确定的视图范围；当所述目标区域来自多于单个纹理视图时，对于所述全景视频的所述目标区域，执行视图混合，其中在卷曲之前或在编码之前，发生所述视图混合；至少部分地基于所述虚拟相机的相机参数以及所述相关联的全景地图，通过30卷曲技术，将所述全景视频的所述目标区域卷曲到输出纹理视图；至少部分地基于所述输出纹理视图来确定所述30视频的左视图和右视图；至少部分地基于所述确定的左视图和右视图，以所述用户视图偏好，显示所述30视频；以及至少部分地基于所述输出纹理视图，执行其他全景视频的画面间预测。13.一种用于在计算机上进行视频编码的系统，包括: 被配置成呈现视频数据的显示设备；通信地耦合到所述显示设备的一个或多个处理器；通信地耦合到所述一个或多个处理器的一个或多个存储器存储； 20解码器，所述20解码器通信地耦合到所述一个或多个处理器并被配置成解码全景视频和相关联的全景地图，其中所述全景视频和所述相关联的全景地图是至少部分地基于多个纹理视图和相机参数生成的；以及 30视频提取逻辑模块，所述30视频提取逻辑模块通信地耦合到所述20解码器，并被配置成至少部分地基于所述全景视...

【专利技术属性】
技术研发人员：邓智玭，J·李，徐理东，江宏，
申请(专利权)人：英特尔公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人