一种基于金字塔结构的光流估计方法技术

技术编号：21972764 阅读：24 留言：0更新日期：2019-08-28 01:45

本发明专利技术涉及一种基于金字塔结构的光流估计方法，包括以下步骤：构建空间金字塔孪生网络模型；构建结构金字塔网络模型，结构金字塔的各个层设置至少一个卷积神经网络，从底层到高层，卷积神经网络的数量依次递减；在光流训练集中获取一组图片对和对应的光流标签；采用空间金字塔孪生网络模型对图片对进行多尺度特征提取和下采样，并将提取的特征对输入到结构金字塔网络模型对应层的卷积神经网络中；参照光流标签，同时对空间金字塔孪生网络模型和结构金字塔网络模型进行训练和微调；在光流测试集上，使用该空间金字塔孪生网络模型和结构金字塔网络模型，获得光流测试集的预测光流场。与现有技术相比，本发明专利技术具有准确度高、效率高等优点。

An Optical Flow Estimation Method Based on Pyramid Structure

全部详细技术资料下载

【技术实现步骤摘要】
一种基于金字塔结构的光流估计方法
本专利技术涉及一种光流估计方法，尤其是涉及一种基于金字塔结构的光流估计方法。
技术介绍
光流是图像亮度模式的表观运动。当人的眼睛观察运动物体时，物体的景象在人眼的视网膜上形成一系列连续变化的图像，这一系列连续变化的信息不断“流过”视网膜(即图像平面)，好像一种光的“流”，故称之为光流。从本质上说，光流就是你在这个运动着的世界里感觉到的明显的视觉运动。光流表达了图像的变化，由于它包含了目标运动的信息，因此可被观察者用来确定目标的运动情况。由光流的定义可以引申出光流场，它是指图像中所有像素点构成的一种二维瞬时速度场，其中的二维速度矢量是景物中可见点的三维速度矢量在成像表面的投影。对光流的研究已经成为计算机视觉及有关研究领域中的一个重要部分。二十多年来，多种光流估计的方法被提出，光流估计的准确性也不断得到提高。但是基于梯度的传统光流计算方法有多个前提假设，比如相邻帧之间的亮度恒定，相邻视频帧的取帧时间连续，相邻帧之间物体的运动比较“微小”，保持空间一致性等。这些假设可能影响在真实情况下的光流计算，导致在实际应用中准确度下降。同时，由于传统光流法采用迭代的方法，计算复杂耗时。基于匹配的传统光流估计算法通过不断地对目标主要特征区域进行定位、跟踪和匹配来计算稀疏光流。虽然这类算法可以对大位移运动和亮度变化的鲁棒性，但难以估计亚像素精度的光流且计算耗时。这两类传统方法如果没有特殊的硬件支持，很难应用于视频序列的实时检测。如今，随着深度学习的发展，越来越多的研究领域开始借助深度学习的方法获得更多研究成果，比如图像分类、目标识别等等。深度学...

【技术保护点】
1.一种基于金字塔结构的光流估计方法，其特征在于，包括以下步骤：S1：构建空间金字塔孪生网络模型；S2：构建结构金字塔网络模型，结构金字塔的各个层设置至少一个卷积神经网络，从底层到高层，卷积神经网络的数量依次递减；S3：在光流训练集中获取一组图片对和对应的光流标签；S4：采用空间金字塔孪生网络模型对图片对进行多尺度特征提取和下采样，并将提取的特征对输入到结构金字塔网络模型对应层的卷积神经网络中；S5：参照光流标签，同时对空间金字塔孪生网络模型和结构金字塔网络模型进行训练和微调；S6：在光流测试集上，使用步骤S5获得的空间金字塔孪生网络模型和结构金字塔网络模型，获得光流测试集的预测光流场。

【技术特征摘要】
1.一种基于金字塔结构的光流估计方法，其特征在于，包括以下步骤：S1：构建空间金字塔孪生网络模型；S2：构建结构金字塔网络模型，结构金字塔的各个层设置至少一个卷积神经网络，从底层到高层，卷积神经网络的数量依次递减；S3：在光流训练集中获取一组图片对和对应的光流标签；S4：采用空间金字塔孪生网络模型对图片对进行多尺度特征提取和下采样，并将提取的特征对输入到结构金字塔网络模型对应层的卷积神经网络中；S5：参照光流标签，同时对空间金字塔孪生网络模型和结构金字塔网络模型进行训练和微调；S6：在光流测试集上，使用步骤S5获得的空间金字塔孪生网络模型和结构金字塔网络模型，获得光流测试集的预测光流场。2.根据权利要求1所述的一种基于金字塔结构的光流估计方法，其特征在于，所述步骤S2中，结构金字塔的每一层中，采用稠密连接的方式将卷积神经网络两两连接，前一个卷积神经网络的输出作为后一个卷积神经网络的输入；层与层之间，每一层的输出经过上采样后作为下一层的输入，最高层的输出经过上采样后作为结构金字塔的输出结果。3.根据权利要求1所述的一种基于金字塔结构的光流估计方法，其特征在于，所述步骤S4中，对图片对进行多尺度特征提取和下采样的具体过程包括：S401：将一对图片分别输入到空间金字塔孪生网络模型的两个输入流中；S402：对两张图片进行多尺度特征提取，并对特征进行激活处理；S403：对特征进行下采样；S404：重复步骤S402和S403多次，获取多组特征对，分别作为位于结构金字塔不同层的卷积神经网络的输入。4.根据权利要求1所述的一种基于金字塔结构的光流估计方法，其特征在于，所述步骤S4中，结构金字塔中的卷积神经网络接收到特征对后，首先对特征对进行特征扭曲和代价体构建，再衔接代价体、初始光流和特征对中的第一个特征，计算残差光流，将初始光流和残...

【专利技术属性】
技术研发人员：王瀚漓，孙泽锋，
申请(专利权)人：同济大学，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人