【技术实现步骤摘要】
一种基于时序多深度平面场的平面视频光场化方法及系统
[0001]本专利技术涉及计算机视觉
,更具体地说,涉及一种基于时序多深度平面场的平面视频光场化方法及系统。
技术介绍
[0002]光场化技术是一种利用光场信息来重建三维场景的技术。传统的光场视频常通过相机阵列采集,需要多个相机同时拍摄同一场景,以获得光场的多视角数据。目前的相机阵列采集面临成本高、光场视频片源较少的问题,且当前海量的视频资源都是平面视频,无法很好的在光场显示屏上进行观看。
[0003]相关技术中,一些用于平面视频立体化的方法通过分析平面图像中的景深信息,实现新视点合成,但这些方法都难以处理遮挡和不可见区域的问题,如果平面图像中有前景物体遮挡了背景而在新的视图中该背景暴露出来时,就会因为背景信息的丢失而造成不真实的感觉。因此,需要新的方法对平面图像中被遮挡的部分进行修复。
[0004]如中国专利文献CN107977938A提供了一种基于光场的Kinect深度图像修复方法,通过采集场景的光场信息,重建场景或物体的一部分深度信息,利用此信息来修复Kinect深度摄像机采集到的深度图像中的空洞部分。此方案结合了光场与Kinect的优势来填补双方的不足,光场的关注点是图像中的色差,色彩丰富的场景利于提取较多的深度数据,而Kinect对于颜色不敏感,但Kinect很难分辨物体的边缘等深度差较大的部分,同时边缘部分的色差比较大,有利于使用光场来提取深度数据。但此方案没有解决因遮挡造成光场化后的视频失真或者模糊的问题。
[0005]由 ...
【技术保护点】
【技术特征摘要】
1.一种基于时序多深度平面场的平面视频光场化方法,包括如下步骤,平面场分配:将输入图像上的每一个像素分配到深度平面上;遮挡修复:将图像中被遮挡部分在多深度平面场中修复还原出来;平面场融合:通过光流辅助融合图像中相邻帧的多深度平面场;平面场渲染:将融合后的多深度平面场渲染出多个视角的视图,实现光场化。2.根据权利要求1所述的基于时序多深度平面场的平面视频光场化方法,其特征在于,平面场分配步骤具体为,对输入的平面视频序列{I
t
|t=1...T}计算深度图,用单目深度估计网络为每一帧的图像计算深度,得到深度图序列{D
t
|t=1
…
T};I
t
为平面视频帧,D
t
为深度图,T为平面视频序列的总帧数且T为大于1的自然数,t为视频序列中的单个帧。3.根据权利要求2所述的基于时序多深度平面场的平面视频光场化方法,其特征在于,对视频序列中的相邻帧t和t+1,预测光流f
t
→
t+1
:f
t
→
t+1
=FlowFormer(I
t
,I
t+1
),对输入的平面视频帧I
t
和深度图D
t
,平面场分配掩膜将I
t
上的每一个像素分配到合适深度的平面上,通过平面场分配模块F
assign
获取平面场分配掩膜获取平面场分配掩膜获取平面场分配掩膜为平面场中的第i个平面所对应的深度,N为平面场的平面数。4.根据权利要求3所述的基于时序多深度平面场的平面视频光场化方法,其特征在于,平面场分配模块F
assign
的网络结构包括:3个降采样模块,由卷积核的大小为3
×
3且步长为2的卷积层、实例标准化层和ReLU激活函数层构成;6个基础块,由卷积核的大小为3
×
3且步长为1的卷积层、实例标准化层和ReLU激活函数层构成;3个放大倍数为2的上采样块;1个softmax层;输出最终的分配掩膜,通过这些分配掩膜将I
t
上的每一个像素分配到合适深度的平面上,5.根据权利要求2或3所述的基于时序多深度平面场的平面视频光场化方法,其特征在于,遮挡修复的步骤具体为,通过编码器ε和解码器对每一层平面中被遮挡的区域进行修复,其中第t帧的多深度平面场P
t
的第i个的平面的修复过程如下:j取值范围是i到N,代表从第i层平面到最后一个平面,代表修复i层平面时将...
【专利技术属性】
技术研发人员:赵洋,刁山鼎,崔浩淼,黄德安邦,范翔宇,唐骏,高正阳,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。