一种基于多分支卷积神经网络的图像和视频增强方法技术

技术编号：19747292 阅读：25 留言：0更新日期：2018-12-12 05:05

本发明专利技术提供一种基于多分支卷积神经网络的图像和视频增强方法，包括：输入低质量的单幅图像或视频序列，稳定求解增强后的图像或者视频；一种新颖的多分支卷积神经网络结构，能够有效解决因光照不足、噪声等因素所导致的图像或视频质量下降问题；一种新颖的训练损失函数，能够有效提高神经网络的精度和稳定度。本发明专利技术的应用之一是无人车(机)驾驶，其原理是针对视频传感器因周围环境变化或干扰所带来的图像质量下降进行处理增强，从而为决策系统提供更高质量的图像及视频信息，从而有助于决策系统做出更加准确、正确的决策。本发明专利技术也可广泛用于视频通话、自动导航、视频监控、短视频娱乐、社交媒体、图像修复等领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多分支卷积神经网络的图像和视频增强方法
本专利技术涉及计算机视觉和图像处理领域，具体地说是一种基于多分支卷积神经网络的图像和视频增强方法。
技术介绍
图像增强作为图像处理领域的基础性问题，对于许多依赖高质量图像和视频的计算机视觉算法来说具有重要意义。现有的计算机视觉算法大多是针对高质量的图片或者视频进行的处理，但是在实际应用中，受成本和自然条件变化的影响，很难获取高质量的图像和视频。图像增强算法在这种情况下可以作为计算机视觉算法的预处理过程，提高计算机视觉算法输入图像和视频的质量，从而提高计算机视觉算法的精度，产生实际应用价值。近年来，深度学习获得了极大的成功，有力的推动了图像处理、计算机视觉、自然语言处理、机器翻译等诸多领域的发展，这充分说明深度学习的强大潜力。同时，考虑到现有的最先进的计算机视觉方法大多采用深度神经网络的方法，因此我们采用深度神经网络的方法进行图像增强能够非常容易的作为预处理部分嵌入到现有的计算机视觉方法中，这对于实际应用中对于整体算法进行固化和优化非常有帮助。图像增强作为图像处理的基础性问题，大量科学家和研究已经进行了非常久的探索，但由于环境问题变化复杂，引起图像质量下降的因素众多，这个问题没有得到完美的解决，依然是一个极富挑战的问题。目前众多的图像增强算法取得广泛应用的算法大致可以分为直方图均衡化(HE)算法、频域变化算法、偏微分方程算法、基于Retinex理论的算法和基于深度学习的算法。图像直方图均衡化算法及其改进都是通过使图像灰度级的概率密度函数满足近似均匀分布的形式来达到增大图像动态范围和提高图像对比度的目的；频域变化...

【技术保护点】
1.一种基于多分支卷积神经网络的图像和视频增强方法，其特征在于，包含以下步骤：(1)根据具体应用场景，采用模拟仿真或人工采集应用场景数据的方法，构建图像或视频的训练数据集；(2)根据应用场景条件，确定多分支卷积神经网络每条分支的网络深度的超参数，构建一个多分支卷积神经网络模型；(3)采用优化方法和目标损失函数，在步骤(1)训练数据集上对步骤(2)构建的多分支卷积神经网络模型进行训练，得到收敛的多分支卷积神经网络模型参数；(4)对于尺寸大于多分支卷积神经网络所限定输入大小的图像，首先对需要处理的图像按照多分支卷积神经网络所限定的输入大小进行分块处理，然后把这些图像块输入到训练好的多分支卷积神经网络模型中进行增强，最后将增强后的图像按照分块处理的逆过程进行拼接，重叠部分取平均，即得到最终的图像处理结果；对于视频的帧数大于多分支卷积神经网络所限定输入大小的视频，首先按照多分支卷积神经网络所限定的输入帧数对需要增强的视频进行分段处理，得到分段后的短视频序列，将这些短视频序列输入到训练好的多分支卷积神经网络模型中进行增强，最后将增强后的视频序列按照分段处理的逆过程进行拼接，重叠部分取平均，即得到最终的视频处理结果。...

【技术特征摘要】
1.一种基于多分支卷积神经网络的图像和视频增强方法，其特征在于，包含以下步骤：(1)根据具体应用场景，采用模拟仿真或人工采集应用场景数据的方法，构建图像或视频的训练数据集；(2)根据应用场景条件，确定多分支卷积神经网络每条分支的网络深度的超参数，构建一个多分支卷积神经网络模型；(3)采用优化方法和目标损失函数，在步骤(1)训练数据集上对步骤(2)构建的多分支卷积神经网络模型进行训练，得到收敛的多分支卷积神经网络模型参数；(4)对于尺寸大于多分支卷积神经网络所限定输入大小的图像，首先对需要处理的图像按照多分支卷积神经网络所限定的输入大小进行分块处理，然后把这些图像块输入到训练好的多分支卷积神经网络模型中进行增强，最后将增强后的图像按照分块处理的逆过程进行拼接，重叠部分取平均，即得到最终的图像处理结果；对于视频的帧数大于多分支卷积神经网络所限定输入大小的视频，首先按照多分支卷积神经网络所限定的输入帧数对需要增强的视频进行分段处理，得到分段后的短视频序列，将这些短视频序列输入到训练好的多分支卷积神经网络模型中进行增强，最后将增强后的视频序列按照分段处理的逆过程进行拼接，重叠部分取平均，即得到最终的视频处理结果。2.根据权利要求1所述的一种基于多分支卷积神经网络的图像和视频增强方法，其特征在于：所述步骤(1)中，采用模拟采集应用场景数据的方法为：针对光线或照明不足所导致图像质量下降时，首先采用伽马变换调整图像亮度，模拟光线不足可能导致的图像或视频细节缺失情况；然后对图像添加泊松噪声来模拟低光条件下传感器可能产生的噪声分布；在视频模拟的时候，保证同一视频帧的伽马变换参数保持相同，不同视频帧的伽马参数随机选择；通过对大规模公开的视频或图像数据集进行处理，即得到视频或图像训练数据集。3.根据权利要求1所述的一种基于多分支卷积神经网络的图像和视频增强方法，其特征在于：步骤(2)中，超参数包括：输入图像的大小、图像归一化方法、网络层数、网络分支个数、网络每层特征个数、卷积操作步长。4.根据权利要求1所述的一种基于多分支卷积神经网络的图像和视频增强方法，其特征在于：步骤(2)中，构造多分支神经网络模型的具体过程如下：(1)构建输入模块，输入模块对视频或图像采用选定的归一化方法进行归一化处理，输入模块的大小即为输入图像的大小；(2)构建特征提取模块，特征提取模块的卷积层个数与网络分支个数保持一致，网络特征个数越多需要消耗内存硬件资源越多，根据实际情况进行选择；然后构建增强模块，增强模块由若干卷积层构成，增强模块的输入为增强模块对应分支的特征提取模块的输出；最后构建融合模块，融合模块接受所有分支的增强模块的输出作为输入，对这些输入进行融合处理得到最终增强结果，融合处理模块实现为：首先将所有分支的增强模块的输出按照最高维度进行拼接，然后进行卷积核大小为1×1的卷积操作得到最终结果；(3)构建多分支卷积神经网络的输出模块，输出模块需要对增强的视频或图像进行归一化操...

【专利技术属性】
技术研发人员：陆峰，吕飞帆，赵沁平，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人