基于压缩感知和卷积神经网络的视频信号测量域估计方法技术

技术编号：20050188 阅读：78 留言：0更新日期：2019-01-09 05:56

本发明专利技术涉及一种基于压缩感知和卷积神经网络的视频信号测量域估计方法，包括：将参考帧图像数据划分为若干宏块；随机选取待估计宏块，选择与待估计宏块在第一方向和第二方向上相邻四个宏块；根据相邻四个宏块计算待估计宏块的像素值和真实测量值；构建卷积神经网络模型，计算待估计宏块的预测测量值；根据真实测量值和预测测量值对卷积神经网络模型进行训练，当卷积神经网络模型输出层的损失函数低于预设阈值时，得到最优参数。本发明专利技术克服了现有技术不能兼顾计算复杂度与模型鲁棒性的问题，可快速分析出视频帧的时间相关性，在非常低的测量率和任意改变的运动向量的条件下仍能实现实时、准确地任意位置宏块分析。

全部详细技术资料下载

【技术实现步骤摘要】
基于压缩感知和卷积神经网络的视频信号测量域估计方法
本专利技术属于视频处理
，具体涉及一种基于压缩感知和卷积神经网络的视频信号测量域估计方法。
技术介绍
随着信息技术的飞速发展，人们对于图像、视频等多媒体信息的要求越来越高，照相机、摄像机等信号采集设备的压力也越来越大。传统的奈奎斯特(Nyquist)采样定理表明，为了不失真地恢复模拟信号，采样频率要求不低于信号最大频率的两倍。经过该采样方法得到的数字信号数据量巨大，且存在信息冗余，不利于存储和传输。基于压缩感知(CompressedSensing，CS)理论的采样技术降低了对采样频率的要求，可以实现低功耗、低复杂度的信息采集，利用该技术可以实现更有效的信息采集、传输、存储以及处理。为了高效地处理视频，基于CS理论的视频压缩感知(CompressedVideoSensing，CVS)编解码系统被提出。它为我们提供了一个低复杂度处理视频信息的有效方法。然而，在CVS系统中，一次采样过后，原始像素域信号转换到了测量域上，由于我们仅仅获得了块的测量值，视频帧间的时间相关性很难准确得到，这使得在测量域上直接获取视频序列的运动信息是不可能的，而视频序列间的运动信息，可以保证解码端在能够良好恢复原视频信号的前提下，减少编码端所需传输的数据量，进一步提高压缩采样效率。另一方面，在视觉信息、语音信息和自然语言处理过程中有很多新兴的工具，深度学习作为一种非常有效工具得到了广泛的应用。其中，卷积神经网络(ConvolutionalNeuralNetwork，CNN)是最具有代表性的深度学习网络模型，非常适用于处理图像和视...

【技术保护点】
1.一种基于压缩感知和卷积神经网络的视频信号测量域估计方法，其特征在于，包括：将视频序列划分为若干图像组，每个图像组包括至少两帧图像数据，选择每个图像组的第一帧作为参考帧，将参考帧图像数据划分为若干宏块；在所述参考帧图像数据中任一位置选取待估计宏块，选择与所述待估计宏块在第一方向和第二方向上相邻四个宏块；根据所述相邻四个宏块计算待估计宏块的像素值和真实测量值；构建卷积神经网络模型，计算待估计宏块的预测测量值；根据所述真实测量值和所述预测测量值对所述卷积神经网络模型进行训练，当卷积神经网络模型输出层的损失函数低于预设阈值时，得到最优参数。

【技术特征摘要】
1.一种基于压缩感知和卷积神经网络的视频信号测量域估计方法，其特征在于，包括：将视频序列划分为若干图像组，每个图像组包括至少两帧图像数据，选择每个图像组的第一帧作为参考帧，将参考帧图像数据划分为若干宏块；在所述参考帧图像数据中任一位置选取待估计宏块，选择与所述待估计宏块在第一方向和第二方向上相邻四个宏块；根据所述相邻四个宏块计算待估计宏块的像素值和真实测量值；构建卷积神经网络模型，计算待估计宏块的预测测量值；根据所述真实测量值和所述预测测量值对所述卷积神经网络模型进行训练，当卷积神经网络模型输出层的损失函数低于预设阈值时，得到最优参数。2.根据权利要求1所述的方法，其特征在于，所述计算待估计宏块的像素值，包括：对所述待估计宏块与所述相邻四个宏块进行建模运算，得到待估计宏块的像素值。3.根据权利要求2所述的方法，其特征在于，所述建模运算的公式为：其中，x(B′)表示待估计宏块像素值，Σ表示求和操作，Γi表示相邻四个宏块的位置关系矩阵，x(Bi)表示相邻四个宏块的像素值，i＝1,2,3,4。4.根据权利要求1所述的方法，其特征在于，所述计算待估计宏块的真实测量值，包括：根据预设规则，计算相邻四个宏块的测量值；根据所述相邻四个宏块的测量值计算待估计宏块的真实测量值。5.根据权利要求4所述的方法，其特征在于，所述预设规则为：y(Bi)＝Φx...

【专利技术属性】
技术研发人员：郭洁，吕军梅，宋彬，姚继鹏，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人