基于卷积神经网络的视频插帧方法技术

技术编号：27752591 阅读：18 留言：0更新日期：2021-03-19 13:48

本发明专利技术提出一种基于卷积神经网络的视频插帧方法，包括：先获取视频连续帧，输入到卷积神经网络中进行降采样和上采样处理，同时进行视频插帧特征的提取和输出；再通过LSTM卷积层，循环输出中间帧；接着计算光流的均方误差并将其作为视频非均匀插帧计算的优化目标函数，实现视频插帧的优化。本发明专利技术避免了现有插帧方法中运动估计过程对插帧质量的影响，可通过深度卷积神经网络直接输出中间帧。

全部详细技术资料下载

【技术实现步骤摘要】
基于卷积神经网络的视频插帧方法
本专利技术属于计算机图像处理
，尤其涉及一种非均匀的视频插帧方法。
技术介绍
视频帧率转换技术是利用视频中相邻两帧之间的相关信息并应用插值的方法将中间帧重建出来的一种技术。由于该技术能在编码中去除冗余信息并降低视频传输过程中的帧率，减少视频网络传输的数据量，因此可应用于视频压缩或增强视频连续性。传统的视频插帧方法主要包括两个步骤，即光流估计和像素合成。在该方法中视频插帧技术的效果往往取决于光流估计的质量，而光流估计的过程容易受到遮挡、模糊的影响出现明显的错误。随着深度学习的发展，基于深度学习的视频插帧技术也有了新的突破，利用卷积神经网络尝试进行视频插帧取得了一定的成功。视频插帧技术是指利用视频中相邻前后帧之间的相关信息，应用插值的方法获得中间帧。视频插帧的目的是在视频中合成新的中间帧，提高视频的帧率。根据新的插值帧的数量与输入视频帧的数量关系，视频插帧可分为均匀插帧与非均匀插帧。均匀插帧是指新的插值帧与输入的视频帧序列按照1:1的比例合成最后新的视频序列，非均匀插帧一般是指新的插值帧与输入的视频序列按照一定的比例合成新的视频序列。传统的视频插帧技术主要是找出视频前后两帧图像的像素间明显的对应关系，最常见的方法就是获取视频前后两帧之间的光流信息。将光流场的信息作为视频前后两帧图像间的对应关系，并利用光流场信息合成中间帧图像。这种传统的方法，插帧质量的好坏很大程度上依赖于光流场信息的质量。在视频插帧技术中，运动估计占有重要的地位，除了直接寻找相...

【技术保护点】
1.基于卷积神经网络的视频插帧方法，其特征在于，包括以下步骤：/n1)获取视频连续帧：/n从真实视频帧中选取相关联的前后帧，并进行归一化，然后输入到卷积神经网络中；/n2)提取视频运动信息并恢复视频空间：/n卷积神经网络前半部分编码模块对归一化处理后的前后帧进行降采样处理，提取前后帧视频间运动信息；然后卷积神经网络后半部分解码模块对降采样处理后的视频间运动信息进行上采样处理，恢复视频空间维度并补偿细节；/n同时，卷积神经网络中间部分，采取skip-connection的方式将网络底层的信息传输到深层网络中，进行视频插帧特征的提取和输出；/n3)输出多个中间帧：/n将步骤2中进行上采样处理后的信息以及视频插帧特征，输入双向LSTM卷积层，循环输出至少一个中间视频帧；/n4)计算光流的均方误差：/n通过预训练的FlowNet分别计算步骤3中的中间视频帧光流和真实视频帧光流；然后计算中间视频帧光流与真实视频帧光流之间的均方误差；/n5)优化插帧：/n将步骤4中的均方误差作为视频非均匀插帧计算的优化目标函数，使FlowNet参与网络优化中梯度后向传播过程，实现视频插帧的优化。/n

【技术特征摘要】
1.基于卷积神经网络的视频插帧方法，其特征在于，包括以下步骤：
1)获取视频连续帧：
从真实视频帧中选取相关联的前后帧，并进行归一化，然后输入到卷积神经网络中；
2)提取视频运动信息并恢复视频空间：
卷积神经网络前半部分编码模块对归一化处理后的前后帧进行降采样处理，提取前后帧视频间运动信息；然后卷积神经网络后半部分解码模块对降采样处理后的视频间运动信息进行上采样处理，恢复视频空间维度并补偿细节；
同时，卷积神经网络中间部分，采取skip-connection的方式将网络底层的信息传输到深层网络中，进行视频插帧特征的提取和输出；
3)输出多个中间帧：
将步骤2中进行上采样处理后的信息以及视频插帧特征，输入双向LSTM卷积层，循环输出至少一个中间视频帧；
4)计算光流的均方误差：
通过预训练的FlowNet分别计算步骤3中的中间视频帧光流和真实视频帧光流；然后计算中间视频帧光流与真实视频帧光流之间的均方误差；
5)优化插帧：
将步骤4中的均方误差作为视频非均匀插帧计算的优化目标函数，使FlowNet参与网络优化中梯度后向传播过程，实现视频插帧的优化。

2.根据权...

【专利技术属性】
技术研发人员：罗斌，贺大林，穆力越，常云鹏，刘军，
申请(专利权)人：西安蓝极医疗电子科技有限公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人