一种基于递归卷积神经网络进行压缩感知视频重建的方法技术

技术编号：15750147 阅读：533 留言：0更新日期：2017-07-03 17:17

本发明专利技术中提出的一种基于递归卷积神经网络进行压缩感知视频重建的方法，其主要内容包括：压缩感知网络(CSNet)、CSNet算法结构、卷积神经网络(CNN)、长短期记忆(LSTM)网络、CSNet网络训练、压缩感知视频重建，其过程为，利用RNN提取运动特征，CNN提取视觉特征，融合二者所提取的信息，利用LSTM网络聚集提取的所有特征，将其和隐藏状态的推断运动组合形成重建。本发明专利技术突破了现有方法在高压缩比下难以保证视频重建质量的问题，设计了一种端到端的训练和非迭代模型，提高CS摄像机的压缩比(CR)，并且提高了视频重建质量，同时减少了数据传输的带宽，使得可以支持高帧率的视频应用。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于递归卷积神经网络进行压缩感知视频重建的方法
本专利技术涉及视频压缩和重建领域，尤其是涉及了一种基于递归卷积神经网络进行压缩感知视频重建的方法。
技术介绍
视频压缩和重建常用于物理与生物科学的研究、视频监控、遥感技术、社交网络等领域，在物理与生物科学的研究上，高速摄像机被用来记录传统相机所不能记载的高速率事件特征，它能记录高速事件的高分辨率静止图像，例如，跟踪“可忽略的运动模糊和图像失真伪影”的爆炸气球。视频监控中，可对监控视频中感兴趣的区域进行重建，对特定人物或车牌的图像进行增强提高辨识度。但是，若帧率为10kfps的摄像机拍摄分辨率为1080P的高清视频，那么每秒可以产生大约500GB的数据，这对现有的传输和存储技术构成了巨大的挑战，如何高效地传输和存储这些大容量视频是目前研究的热点。本专利技术提出了一种基于递归卷积神经网络进行压缩感知视频重建的方法，利用卷积神经网络(CNN)和递归神经网络(RNN)来提取时空特征，包括背景、对象细节、和运动信息，达到了更好的重建质量。具体地，随机编码器并行运行，利用较多的测量编码视频里的首帧，同时利用较少的测量编码剩余帧，对于每个压缩测量，有特定的CNN从中提取空间特征，长短记忆(LSTM)网络聚集了由每个CNN提取的所有特征，和隐藏状态的推断运动一起形成重建。本专利技术突破了将视频视为一系列独立图像的传统处理方式的局限，通过RNN将时间信息应用于重建过程，从而生成更多精确的模型，除此之外本方法还在保持较好的原始视频视觉细节的基础上，提高了压缩比并且减少了数据传输的宽带，提高了视频重建质量，支持高帧率的视频应用...
一种基于递归卷积神经网络进行压缩感知视频重建的方法

【技术保护点】
一种基于递归卷积神经网络进行压缩感知视频重建的方法，其特征在于，主要包括压缩感知网络(CSNet)(一)；CSNet算法结构(二)；卷积神经网络(CNN)(三)；长短期记忆(LSTM)网络(四)；CSNet网络训练(五)；压缩感知视频重建(六)。

【技术特征摘要】
1.一种基于递归卷积神经网络进行压缩感知视频重建的方法，其特征在于，主要包括压缩感知网络(CSNet)(一)；CSNet算法结构(二)；卷积神经网络(CNN)(三)；长短期记忆(LSTM)网络(四)；CSNet网络训练(五)；压缩感知视频重建(六)。2.基于权利要求书1所述的压缩感知网络(CSNet)(一)，其特征在于，压缩感知网络(CSNet)是一种深度神经网络，可以从随机测量中了解视觉表示，用于压缩感知视频重建，是一种端到端的训练和非迭代模型，结合了卷积神经网络(CNN)和递归神经网络(RNN)，从而利用时空特征进行视频重建，这个网络结构可以接收伴有多级压缩比(CR)的随机测量，分别地提供了背景信息和对象细节，达到更好的重建质量。3.基于权利要求书2所述的递归神经网络(RNN)，其特征在于，对于视频重建应用，模拟时间进程非常重要，通过建立基于信息的当前帧，这些信息包含当前帧、以及补丁之间的外推时间依赖关系，递归神经网络(RNN)将时间信息应用于重建过程，可以用来生成更多精确的模型。4.基于权利要求书1所述的CSNet算法结构(二)，其特征在于，该结构包含三个模块：用于测量的随机编码、用于视觉特征提取的CNN聚类、用于时间重建的LSTM，随机编码器并行运行，利用较多的测量编码视频里的首帧，同时利用较少的测量编码剩余帧，可以接受多级压缩比(CR)测量，通过此算法，关键帧和非关键帧(主要贡献运动信息的其余帧)分别被压缩，递归神经网络(RNN)推算出运动信息，且将这些信息与通过卷积神经系统(CNN)提取的视觉特征相结合，合成高质量的帧，高效的信息融合，能使压缩感知(CS)视频应用的保真度和压缩比(CR)之间得达到最优的平衡。5.基于权利要求书1所述的卷积神经网络(CNN)(三)，其特征在于，该网络对图像进行压缩测量和外放重建，把时间压缩和空间压缩结合在一起以最大化压缩比，设计一个较大的CNN来处理关键帧，因为关键帧含有高熵信息，同时，设计一个较小的CNN来处理非关键帧，为了减少系统的延迟以及简化网络结构，使用图像块作为输入，此时，由CNN生成的所有特征图的大小和图像块相同，特征图的数量单调下降，此网络输入是由压缩测量组...

【专利技术属性】
技术研发人员：夏春秋，
申请(专利权)人：深圳市唯特视科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人