基于深度递归神经网络的视频去噪方法技术

技术编号：14417851 阅读：981 留言：0更新日期：2017-01-12 12:32

本发明专利技术提供一种基于深度递归神经网络的视频去噪方法，所述方法采用端到端的深度神经网络模型，所述深度神经网络模型包含两层递归神经网络，将有噪视频作为输入，第一层递归神经网络通过递归和非线性运算获得视频的初级特征，并将其作为输出传递到下一层递归神经网络，视频在第二层递归网络中获得高级特征，输出层利用两层递归神经网络获得的特征解码重构最终输出去噪后的视频；本发明专利技术利用时间域的递归结构端到端地进行视频去噪，无须通过其他复杂算法获取视频的运动信息；利用深度网络结构强大的表达能力实现有噪视频与去噪视频之间的映射；能够延展并应用在各种不同类型的噪声中，如高斯噪声、泊松‑高斯混合噪声等。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及的是一种视频图像处理
的方法，具体是一种基于深度递归神经网络的视频去噪方法。
技术介绍
视频去噪是一个视频图像处理
的典型问题，同时也是像素级视频处理方法评价方法。因此该问题在学术界和工业界一直受到广泛的关注。视频去噪过程是输入一个加噪视频Y＝X+N,其中X表示为是Y的原始视频，通过特定方法以后，输出一个去噪视频。在过去十多年间，许多方法都在图像去噪和视频去噪取得了巨大的进步，如稀疏编码(sparsecoding)、条件随机域(conditionalrandomfields)、变换技术(variationtechniques)、块方法(patchbasedmethods)等。视频去噪技术与图像去噪技术最大的不同在于视频有大量运动信息和时间域冗余信息可以用于去噪过程。一种通用的方法是将图像去噪通过在时间轴的不同帧中查找相似块的方法，然后利用图像去噪的方法，如小波压缩(waveletshrinkage)或是维纳滤波等方法在三维变换域进行去噪，如VBM3D(Block-matchingand3Dfiltering(BM3D))。VBM4D在VBM3D方法中做了改进并成为目前最为先进的图像去噪技术。VBM4D去噪的方法是查找相似3维时空立体块而不是2维平面块然后将3维立体块堆栈形成一个四维结构。然后利用协同滤波去除该四维结构的相关性，最后利用压缩(shrinkage)和反变换完成视频去噪。目前，深度学习得利于其深度神经网络结构的强大表达能力和GPU(GraphicsProcessingUnits)的快速运算能力，在计算机视觉和模式识别领...
基于深度递归神经网络的视频去噪方法

【技术保护点】
一种基于深度递归神经网络的视频去噪方法，其特征在于：所述方法采用端到端的深度神经网络模型，利用时间域的递归结构端到端地进行视频去噪；所述深度神经网络模型包含两层递归神经网络，将有噪视频作为输入，第一层递归神经网络通过递归和非线性运算获得视频的初级特征，并将其作为输出传递到下一层递归神经网络，视频在第二层递归网络中获得高级特征，输出层利用两层递归神经网络获得的特征解码重构最终输出去噪后的视频；所述深度神经网络模型，具体表示如下：h1(t)=σ(Wh1xx(t)+Wh1h1h1(t-1)+bh1)]]>hl(t)=σ(Whlhl-1hl-1(t)+Whlhlhl(t-1)+bhl)]]> y(t)＝σ(Wyhh(t)+by)其中，x(t)表示输入数据，表示深度递归神经网络第一层t时刻和t‑1的状态，表示深度递归神经网络第l层t时刻、第l‑1层t时刻、第l层t‑1的状态，y(t)表示输出数据；by均为模型的参数，通过BPTT算法最小化损失函数获得；t表示视频图像的时间序列索引。

【技术特征摘要】
1.一种基于深度递归神经网络的视频去噪方法，其特征在于：所述方法采用端到端的深度神经网络模型，利用时间域的递归结构端到端地进行视频去噪；所述深度神经网络模型包含两层递归神经网络，将有噪视频作为输入，第一层递归神经网络通过递归和非线性运算获得视频的初级特征，并将其作为输出传递到下一层递归神经网络，视频在第二层递归网络中获得高级特征，输出层利用两层递归神经网络获得的特征解码重构最终输出去噪后的视频；所述深度神经网络模型，具体表示如下：h1(t)=σ(Wh1xx(t)+Wh1h1h1(t-1)+bh1)]]>hl(t)=σ(Whlhl-1hl-1(t)+Whlhlhl(t-1)+bhl)]]>y(t)＝σ(Wyhh(t)+by)其中，x(t)表示输入数据，表示深度递归神经网络第一层t时刻和t-1的状态，表示深度递归神经网络第l层t时刻、第l-1层t时刻、第l层t-1的状态，y(t)表示输出数据；by均为模型的参数，通过BPTT算法最小化损失函数获得；t表示视频图像的时间序列索引。2.根据权利要求1所述的基于深度递归神经网络的视频去噪方法，其特征在于，所述深度神经网络模型将视频噪声模型与深度递归网络结合，利用深度网络结构强大的表达能力实现有噪视频...

【专利技术属性】
技术研发人员：宋利，陈欣苑，杨小康，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人