一种针对两阶段卷积神经网络的视频降噪方法技术

技术编号：38878828 阅读：13 留言：0更新日期：2023-09-22 14:10

本发明专利技术公开了一种针对两阶段卷积神经网络的视频降噪方法，包括以下步骤：将去噪过程分成两阶段，第一阶段采用盲空间去噪器对不同噪声进行去噪；第二阶段采用时间去噪块进行去噪以减少视频的闪烁情况；在第一阶段，目标是使用一个盲目的空间去噪器对输入帧进行单独去噪；在下一阶段使用时间去噪块前，首先采用光流技术，将相邻的T个帧扭曲到中心帧，然后将2T+1个对齐的帧串联起来，并送入一个时间去噪块进行去噪；对去噪视频重复运行这一流程至遍历测试数据集的全部视频序列的全部视频帧。本发明专利技术利用相邻帧的时间信息的时间去噪块，将两个去噪块相结合，可以在去除不同类型的噪声基础上，消除视频闪烁问题，提高去噪视频的质量。提高去噪视频的质量。提高去噪视频的质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对两阶段卷积神经网络的视频降噪方法

[0001]本专利技术涉及计算机视觉领域，特别涉及一种针对两阶段卷积神经网络的视频降噪方法。

技术介绍

[0002]视频信号产生噪声的主要原因是在对其进行采集、压缩、传输等过程中受到所使用的设备、周围环境以及传输信道等因素的干扰而产生了数字失真。视频噪声会导致接受到的视频信号质量严重下降，这不仅会让视频观感变差，还大大增加后续对视频图像的处理分析的难度。因此，视频降噪算法的研究有着广泛的应用价值和实际意义。
[0003]深度学习的进展使卷神经网络(CNN)在图像和视频降噪领域大受欢迎。经过几十年的研究，大量优秀的算法已经被开发出来，特别是针对高斯噪声的去除。大多数CNN降噪器都应用了一个判别性学习框架，这种框架使用关于噪声分布和清洁噪声的先验知识进行训练。然而，图像噪声的形成是一个复杂的过程，所以现实中的噪声很难建模。当噪声分布预先知道的时候，那些用自我监督策略训练的模型在合成实验中可以很好的工作。但是这些方法在处理真实世界中未知分布的噪声时，效果往往会变得十分糟糕。为了缓解这个问题，一些方法使用被多个不同分布和水平的噪声破坏的复合训练集进行训练，比如Dn CNN
‑
B。这种方法虽然在一定程度上缓解了训练和测试时噪声分布不匹配的问题，但基于CNN的去噪器需要大量的无噪声图像对进行训练，而要在现实生活中获得足够多的无噪声图像对是十分困难的。对于静止图像，一些研究试图通过对某一场景中数百幅噪声图像进行平均来获得无噪声图像。另一方面，也有研究提出提出通过改...

【技术保护点】

【技术特征摘要】
1.一种针对两阶段卷积神经网络的视频降噪方法，其特征在于，包括以下步骤：将去噪过程分成两阶段，第一阶段采用盲空间去噪器对不同噪声进行去噪；第二阶段采用时间去噪块进行去噪以减少视频的闪烁情况；在第一阶段，目标是使用一个盲目的空间去噪器对输入帧进行单独去噪；在下一阶段使用时间去噪块前，首先采用光流技术，将相邻的T个帧扭曲到中心帧，然后将2T+1个对齐的帧串联起来，并送入一个时间去噪块进行去噪；对去噪视频重复运行这一流程至遍历测试数据集的全部视频序列的全部视频帧。2.根据权利要求1所述的针对两阶段卷积神经网络的视频降噪方法，其特征在于，包括以下步骤：步骤1：生成一对同一场景的噪声图像，假设视频第t帧图像x
t
，则和它形成图像对的图像选取它的前一帧即第t
‑
1帧图像；步骤2：将第t帧图像x
t
的噪声观测值记为f
t
，将第t
‑
1帧图像的噪声记为f
t
‑1，将f
t
和f
t
‑1输入到光流网络，使用网络将前一帧图像扭曲到当前帧，计算第t帧和第t
‑
1帧之间的因光流扭曲的噪声观测值w(f
t
‑1)；步骤3：将图像f
t
、f
t
‑1和w(f
t
‑1)输入到去噪网络F
θ
，分别得到f
t
、f
t
‑1和w(f
t
‑1)去噪后的图像F
θ
(f
t
)、F
θ
(f
t
‑1)和F
θ
(w(f
t
‑1))；步骤4：使用图像对(f
t
、w(f
t
‑1))，通过最小化损失来训练网络，其中E代表的是期望计算；步骤5：由理论知识可知，图像x
t
与w(f
t
‑1)并非完全相等，其图像之间存在非零间隙ε，即所以对步骤4中的式子引入一个约束：E{f
t
‑
F
θ
(w(f
t
‑1))
‑
F
θ
(w(f
t
)+w(F
θ
(f
t
‑1))}＝0其中，w(F
θ
(f
t
‑1))是对F
θ

【专利技术属性】
技术研发人员：李福生，万优，鲁欣，张焕龙，赵彦春，
申请(专利权)人：电子科技大学长三角研究院湖州，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人