【技术实现步骤摘要】
一种基于成本量修正的光流预测方法及系统
[0001]本专利技术涉及计算机视觉
,特别是涉及一种基于成本量修正的光流预测方法及系统。
技术介绍
[0002]光流(Optical Flow)是视频中相邻两帧图像之间对应点的位置变化,可以用于描述视频中的运动信息,这种运动由相机和场景的相对运动产生,运动的存在使得视频中相邻两帧图像的亮度模式发生改变,光流计算方法需要根据图像之间的亮度变化来计算光流。光流是计算机视觉领域中的一个重要研究对象,在日常生活中有着广泛的应用,比如:目标跟踪、自动驾驶、动作识别、视频插帧,因此对光流的研究有着重要的理论意义与应用价值。
[0003]光流的研究历史已经有数十年,从早期的变分方法演变到今天的深度学习方法。在使用了深度学习技术的光流计算方法中,成本量(CostVolume)是一个关键中间结果,光流计算模型通过对参考帧和目标帧的高维特征执行相关(Correlation)操作来得到成本量,然后从成本量中求解光流,成本量会对光流结果的准确性造成重要影响。
[0004]然而,由于图像数据中经常存在遮挡区域以及模糊现象,导致计算出的成本量中含有大量异常值,这会降低光流结果的准确性。
技术实现思路
[0005]本专利技术实施例的目的是提供一种基于成本量修正的光流预测方法及系统,以提高光流预测结果的准确性。
[0006]为实现上述目的,本专利技术实施例提供了如下方案:
[0007]一种基于成本量修正的光流预测方法,包括:
[0008]获取原始 ...
【技术保护点】
【技术特征摘要】
1.一种基于成本量修正的光流预测方法,其特征在于,包括:获取原始图像,训练集和测试集;将所述训练集输入神经网络模型进行训练,得到CVCFlow光流网络;将所述原始图像中的测试帧输入所述CVCFlow光流网络进行测试,得到光流预测结果;将所述光流预测结果与所述测试集进行对比,得到对比结果;根据所述对比结果优化所述CVCFlow光流网络,得到优化后的CVCFlow光流网络;将所述原始图像中的参考帧和目标帧输入所述优化后的CVCFlow光流网络进行特征编码,得到高维特征;将所述高维特征进行成本量计算,得到成本量;对所述成本量进行修正,得到修正后的成本量;将所述修正后的成本量进行解码,得到最终光流预测结果。2.根据权利要求1所述的基于成本量修正的光流预测方法,其特征在于,所述原始图像包括:所述测试帧,所述参考帧和所述目标帧;所述训练集包括:FlyingChairs数据集和FlyingThings3D数据集;所述测试集包括:Sintel数据集和KITTI
‑
15数据集。3.根据权利要求2所述的基于成本量修正的光流预测方法,其特征在于,将所述训练集输入神经网络模型进行训练,得到CVCFlow光流网络具体包括:将所述FlyingChairs数据集输入神经网络模型进行训练时,所述FlyingChairs数据集中图像的分辨率为496*368,并对所述FlyingChairs数据集中图像进行水平翻转和垂直翻转;将所述FlyingThings3D数据集输入神经网络模型进行训练时,所述FlyingThings3D数据集中图像的分辨率为720*400,并对所述FlyingThings3D数据集中图像进行水平翻转和垂直翻转。4.根据权利要求3所述的基于成本量修正的光流预测方法,其特征在于,将所述训练集输入神经网络模型进行训练,得到CVCFlow光流网络还包括:使用损失函数L对所述神经网络模型进行训练;所述损失函数L为:其中,α为0.8,u
gt
为光流真实值,u
i
是第i次迭代计算出的光流预测结果,N为总迭代次数,||||1表示L1范数。5.根据权利要求4所述的基于成本量修正的光流预测方法,其特征在于,将所述原始图像中的测试帧输入所述CVCFlow光流网络进行测试,得到光流预测结果;将所述光流预测结果与所述测试集进行对比,得到对比结果具体包括:将所述原始图像中的测试帧输入所述CVCFlow光流网络中,所述CVCFlow光流网络输出所述光流预测结果计算所述光流真实值u
gt
与所述光流预测结果之间的终点误差,所述终点误差为所述对比结果;所述终点误差EPE的计算公式如下所示:
其中,||||2表示L2范数。6.根据权利要求5所述的基于成本量修正的光流预测方法,其特征在于,根据所述对比结果优化所述CVCFlow光流网络,得到优化后的CVCFlow光流网络具体包括:采用AdamW优化算法对所述CVCFlow光流网络进行优化;采用OneCycle策略调整所述CVCFlow光流网络训练过程中的学习率。7.根据权利要求6所述的基于成本量修正的光流预测方法,其特征在于,将所述原始图像中的参考帧和目标帧输入所述优化后的CVCFlow光流网络进行特征编码,得到高维特征具体包括:采用特征编码器对所述参考帧和目标帧进行特征提取,得到所述高维特征;所述特征编码器至少包括:a个N*M卷积层,b个残差通道注意力块。8.根据权利要求6所述的基于成本量修正的光流预测方法,其特征在于,将所述高维特征进行成本量计算,得到成本量;对所述成本量...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。