多视图场景分割和传播制造技术

技术编号：20597154 阅读：25 留言：0更新日期：2019-03-16 12:44

可以对多视图视频流应用基于深度的效果以生成修改后的多视图视频流。用户输入可以指定所述视频流的参考图像的前景区域和与所述前景区域不同深度处的背景区域之间的边界。基于所述用户输入，可以生成参考掩模以指示所述前景区域和所述背景区域。所述参考掩模可以用于生成一个或多个其它掩模，所述一个或多个其它掩模指示来自所述参考图像的不同帧和/或不同视图的一个或多个不同图像的前景区域和背景区域。所述参考掩模和其它掩模可以用于将所述效果应用于所述多视图视频流以生成所述修改后的多视图视频流。

Multi-view Scene Segmentation and Propagation

Depth-based effects can be applied to multi-view video streams to generate modified multi-view video streams. The user input may specify the boundary between the foreground area of the reference image of the video stream and the background area at different depths of the foreground area. Based on the user input, a reference mask can be generated to indicate the foreground area and the background area. The reference mask can be used to generate one or more other masks indicating the foreground and background regions of one or more different images from different frames and/or views of the reference image. The reference mask and other masks can be used to apply the effects to the multi-view video stream to generate the modified multi-view video stream.

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】多视图场景分割和传播相关申请的交叉引用本申请要求2017年3月17日提交的“Multi-ViewSceneSegmentationandPropagation”(代理人案号LYT287)的美国技术申请序号15/462,752的优先权，其公开内容通过引用整体地并入在本文中。本申请要求2016年6月9日提交的“UsingLight-FieldImageDataforBackgroundColorSpillSuppression”(代理人案号LYT255-PROV)的美国临时申请序号62/347,734的权益，其公开内容通过引用整体地并入在本文中。本申请涉及2015年8月27日提交的“Depth-BasedApplicationofImageEffects”(代理人案号LYT203)的美国申请序号14/837,465，其公开内容通过引用整体地并入在本文中。本申请涉及2016年3月29日提交的“CapturingLight-FieldVolumeImagesandVideoDataUsingTiledLight-FieldCameras”(代理人案号LYT217)的美国技术申请序号15/084,326，其公开内容通过引用整体地并入在本文中。
本公开涉及用于处理图像数据的系统和方法，并且更具体地，涉及用于分割被捕获以用在虚拟现实或增强现实应用中的光场图像和/或体积视频中的场景的系统和方法。
技术介绍
编辑常规或光场图像以提供效果诸如改变着色、改变对比度或者插入和/或移除图像中的对象可以是有挑战性的。通常，用户必须谨慎选择对象边界以控制效果如何被应用。因此，基于深度的...

【技术保护点】
1.一种用于对视频流应用效果的方法，所述方法包括：在数据存储中，接收视频流；在输入设备中，接收指定所述视频流的参考图像的前景区域和与所述前景区域不同深度处的背景区域之间的边界的第一用户输入；在处理器中，基于所述第一用户输入生成指示所述前景区域和所述背景区域的参考掩模；在所述处理器中，使用所述参考掩模来生成第一非参考掩模，所述第一非参考掩模指示所述视频流的与所述参考图像不同的第一非参考图像的前景区域和背景区域；以及在所述处理器中，通过使用所述参考掩模来将效果应用于所述参考图像并且使用所述第一非参考掩模来将所述效果应用于所述第一非参考图像而生成修改后的视频流。

【技术特征摘要】
【国外来华专利技术】2016.06.09 US 62/347,734;2017.03.17 US 15/462,7521.一种用于对视频流应用效果的方法，所述方法包括：在数据存储中，接收视频流；在输入设备中，接收指定所述视频流的参考图像的前景区域和与所述前景区域不同深度处的背景区域之间的边界的第一用户输入；在处理器中，基于所述第一用户输入生成指示所述前景区域和所述背景区域的参考掩模；在所述处理器中，使用所述参考掩模来生成第一非参考掩模，所述第一非参考掩模指示所述视频流的与所述参考图像不同的第一非参考图像的前景区域和背景区域；以及在所述处理器中，通过使用所述参考掩模来将效果应用于所述参考图像并且使用所述第一非参考掩模来将所述效果应用于所述第一非参考图像而生成修改后的视频流。2.根据权利要求1所述的方法，还包括，在显示设备中，显示所述修改后的视频流。3.根据权利要求1所述的方法，还包括，在所述数据存储中接收所述视频流之前，在相机中捕获所述视频流。4.根据权利要求1所述的方法，其中：所述参考图像来自所述视频流的参考帧；以及所述第一非参考图像来自所述视频流的与所述参考帧不同的第一帧。5.根据权利要求4所述的方法，还包括，在所述处理器中，使用所述第一非参考掩模来生成第二非参考掩模，所述第二非参考掩模指示来自所述视频流的与所述参考帧和所述第一帧不同的第二帧的第二非参考图像的前景区域和背景区域；其中，生成所述修改后的视频流还包括使用所述第二非参考掩模来将所述效果应用于所述第二非参考图像。6.根据权利要求1所述的方法，其中，所述视频流包括多视图视频流。7.根据权利要求6所述的方法，还包括，在显示设备中，将所述修改后的视频流显示为虚拟现实或增强现实体验。8.根据权利要求6所述的方法，其中：所述参考图像来自所述视频流的参考帧的参考视图；以及所述第一非参考图像来自所述视频流的所述参考帧的与所述参考视图不同的第一视图。9.根据权利要求8所述的方法，还包括，在所述处理器中，使用所述第一非参考掩模来生成第二非参考掩模，所述第二非参考掩模指示来自所述视频流的所述参考帧的与所述参考视图和所述第一视图不同的第二视图的第二非参考图像的前景区域和背景区域；其中，生成所述修改后的视频流还包括使用所述第二非参考掩模来将所述效果应用于所述第二非参考图像。10.根据权利要求1所述的方法，还包括，在所述输入设备中，在接收所述第一用户输入之前，接收从所述视频流的多个图像当中指定所述参考图像的第二用户输入。11.根据权利要求1所述的方法，其中，生成所述参考掩模包括：使用所述边界来计算指定所述参考图像的所述前景区域和所述背景区域的初始二元分割；细化所述边界以刻划更准确地指定所述前景区域和所述背景区域的精细边界；以及使用所述精细边界来生成所述参考掩模。12.根据权利要求11所述的方法，其中，使用所述精细边界来生成所述参考掩模包括使用所述精细边界来生成进一步指示所述前景区域与所述背景区域之间的未知区域的三元图，所述未知区域包含可以属于所述前景区域或所述背景区域的像素。13.根据权利要求12所述的方法，还包括，在所述处理器中，对所述三元图应用抠图算法以获得包括用于所述前景区域、所述背景区域和所述未知区域中的所述像素的alpha值的alpha蒙版。14.根据权利要求13所述的方法，其中，所述视频流包括由一个或多个光场相机捕获的光场视频。15.根据权利要求14所述的方法，还包括将所述alpha蒙版和所述前景区域的前景图像反投影到所述光场视频。16.根据权利要求12所述的方法，其中，使用所述参考掩模来生成所述第一非参考掩模包括：指定所述第一非参考图像的第一非参考分段和第二非参考分段之间的第一非参考边界；使用所述第一非参考边界来计算指定所述第一非参考图像的所述第一非参考分段和所述第二非参考分段的初始非参考二元分割；细化所述第一非参考边界以刻划更准确地指定所述第一非参考分段和所述第二非参考分段的精细非参考边界；以及使用所述精细非参考边界来生成进一步指示所述第一非参考分段与所述第二非参考分段之间的未知非参考分段的非参考三元图，所述未知非参考分段包含可以属于所述第一非参考分段或所述第二非参考分段的非参考像素。17.根据权利要求16所述的方法，还包括，在所述处理器中，对所述非参考三元图应用抠图算法以获得非参考alpha蒙版以生成所述前景区域的非参考前景图像，所述非参考alpha蒙版包括所述未知非参考分段中的所述非参考像素的非参考alpha值。18.一种用于对视频流应用效果的非暂时性计算机可读介质，包括存储在其上的指令，所述指令在由处理器执行时，执行以下各项的步骤：使得数据存储接收视频流；使得输入设备接收指定所述视频流的参考图像的前景区域和与所述前景区域不同深度处的背景区域之间的边界的第一用户输入；基于所述第一用户输入生成指示所述前景区域和所述背景区域的参考掩模；使用所述参考掩模来生成第一非参考掩模，所述第一非参考掩模指示所述视频流的与所述参考图像不同的第一非参考图像的前景区域和背景区域；以及通过使用所述参考掩模来将效果应用于所述参考图像并且使用所述第一非参考掩模来将所述效果应用于所述第一非参考图像而生成修改后的视频流。19.根据权利要求18所述的非暂时性计算机可读介质，还包括存储在其上的指令，所述指令在由处理器执行时，使得显示设备显示所述修改后的视频流。20.根据权利要求18所述的非暂时性计算机可读介质，还包括存储在其上的指令，所述指令在由处理器执行时，使得相机在所述数据存储中接收所述视频流之前捕获所述视频流。21.根据权利要求18所述的非暂时性计算机可读介质，其中：所述参考图像来自所述视频流的参考帧；所述第一非参考图像来自所述视频流的与所述参考帧不同的第一帧；所述非暂时性计算机可读介质还包括存储在其上的指令，所述指令在由处理器执行时，使用所述第一非参考掩模来生成第二非参考掩模，所述第二非参考掩模指示来自所述视频流的与所述参考帧和所述第一帧不同的第二帧的第二非参考图像的前景区域和背景区域；以及生成所述修改后的视频流还包括使用所述第二非参考掩模来将所述效果应用于所述第二非参考图像。22.根据权利要求18所述的非暂时性计算机可读介质，其中：所述视频流包括多视图视频流；以及所述非暂时性计算机可读介质还包括存储在其上的指令，所述指令在由处理器执行时，使得显示设备将所述修改后的视频流显示为虚拟现实或增强现实体验。23.根据权利要求18所述的非暂时性计算机可读介质，其中：所述视频流包括多视图视频流；所述参考图像来自所述视频流的参考帧的参考视图；所述第一非参考图像来自所述视频流的所述参考帧的与所述参考视图不同的第一视图；所述非暂时性计算机可读介质还包括存储在其上的指令，所述指令在由处理器执行时，使用所述第一非参考掩模来生成第二非参考掩模，所述第二非参考掩模指示来自所述视频流的所述参考帧的与所述参考视图和所述第一视图不同的第二视图的第二非参考图像的前景区域...

【专利技术属性】
技术研发人员：弗朗索瓦·布莱贝尔，杜廷芳，托马斯·诺恩，谭杰，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人