用于优化图像的方法及系统技术方案

技术编号:37913858 阅读:11 留言:0更新日期:2023-06-21 22:36
本发明专利技术提供了一种用于优化图像的方法及系统,该系统存储特征提取网络和优化网络的参数。该系统接收输入,该输入包括退化图像及与该退化图像联级的退化估计;执行特征提取网络的操作以将预训练的权重应用于该输入以生成特征图;以及,执行优化网络的操作,其中,该优化网络包括一系列的动态模块。该动态模块中的一个或多个动态地生成网格内核,以应用于从该系列动态模块中的前一动态模块输出的中间图像的对应网格。每个网格内核都是基于中间图像和特征图生成的。和特征图生成的。和特征图生成的。

【技术实现步骤摘要】
用于优化图像的方法及系统


[0001]本专利技术通常涉及神经网络,以及更具体地,涉及用于优化图像的方法及系统。

技术介绍

[0002]深度卷积神经网络(Deep Convolutional Neural Networks,CNN)已广泛用于图像处理,例如,图像优化(image refinement)和超分辨率。深度卷积神经网络(CNN)已用于恢复因模糊(blur)、噪声(noise)、低分辨率(low resolution)等因素而被退化的图像。深度卷积神经网络(CNN)能够有效解决单图像超分辨率(single image super

resolution,SISR)问题,其中,高分辨率(high

resolution,HR)图像是从低分辨率(low

resolution,LR)图像重建得到的。
[0003]一些基于深度卷积神经网络(CNN)的方法基于退化图像受一种固定组合的退化效应的影响,例如模糊和双三次下采样(bicubic down

sampling)。这些方法在处理退化效应因图像而异的退化图像时的能力有限。这些方法也不能处理在图像的一个区域中具有一种组合的退化效应而在同一图像的另一区域中具有另一种组合的退化效应的图像。
[0004]另一种方法是针对每种组合的退化效应训练单独的网络。例如,如果图像受三种不同组合的退化效应的退化:双三次下采样、双三次下采样和噪声,以及,直接下采样和模糊,则三个网络被训练,以处理这些退化
[0005]因此,需要改进现有的方法来优化受可变退化效应影响的图像。

技术实现思路

[0006]有鉴于此,本专利技术的目的之一在于提供一种用于优化图像的方法及系统,以增强图像质量。
[0007]第一方面,本专利技术提供了一种用于优化图像的方法,包括:接收输入,该输入包括退化图像与该退化图像的退化估计联级后的输出数据;执行特征提取操作,以将预训练的权重应用于该输入,并生成特征图;以及,执行优化网络的操作,其中,该优化网络包括具有多个动态模块的动态模块序列,以及,一个或多个动态模块动态地生成网格内核,以应用于从该动态模块序列中的前一动态模块输出的中间图像的对应网格,其中,每个网格内核是基于该中间图像和该特征图生成的。
[0008]在一些实施例中,该一个或多个动态模块中的每一个动态模块包括卷积层的第一路径和卷积层的第二路径,该第一路径对该中间图像和该特征图进行操作以生成对应的网格内核,该第二路径对该中间图像和该特征图进行操作以生成残差图像。
[0009]在一些实施例中,该方法还包括:对该第一路径的输出和该第二路径的输出执行逐像素加法。
[0010]在一些实施例中,该动态模块序列中的第一个动态模块动态地生成网格内核以应用于该退化图像的对应网格。
[0011]在一些实施例中,该退化图像是低分辨率图像,以及,该优化网络执行超分辨率操
作以输出高分辨率图像。
[0012]在一些实施例中,执行特征提取操作的步骤进一步包括:执行残差模块的操作,每个残差模块包括卷积层和修正线性单元(Rectified Linear Unit,ReLU)层。
[0013]在一些实施例中,执行该优化网络的操作还包括:该动态模块序列中的至少一个动态模块生成通道维度被扩展r
×
r倍的上采样动态内核,其中,r是上采样率;以及,将该上采样动态内核与输入图像进行卷积,以将该输入图像上采样r
×
r倍。
[0014]在一些实施例中,每个动态模块是由差值度量训练的,该差值度量测量地面实况图像和该动态模块的输出之间的差值。
[0015]在一些实施例中,该退化估计指示该退化图像的不同区域中的退化,每个区域中的退化包括以下各项中的一项或多项:下采样、模糊和噪声。
[0016]在一些实施例中,每个对应网格包括一个或多个图像像素,该一个或多个图像像素共享并使用相同的网格内核。
[0017]第二方面,本专利技术提供了一种用于实现优化图像之系统,该系统包括存储器和处理硬件,该存储器用于存储特征提取网络和优化网络的参数,该处理硬件耦接该存储器,且被配置为:接收输入,该输入包括退化图像与该退化图像的退化估计联级后的输出数据;执行特征提取操作,以将预训练的权重应用于该输入,并生成特征图;以及,执行优化网络的操作,其中,该优化网络包括具有多个动态模块的动态模块序列,以及,一个或多个动态模块动态地生成网格内核,以应用于从该动态模块序列中的前一动态模块输出的中间图像的对应网格,其中,每个网格内核是基于该中间图像和该特征图生成的。
[0018]在一些实施例中,该一个或多个动态模块中的每一个动态模块包括卷积层的第一路径和卷积层的第二路径,该第一路径对该中间图像和该特征图进行操作以生成对应的网格内核,该第二路径对该中间图像和该特征图进行操作以生成残差图像。
[0019]在一些实施例中,该处理硬件还用于:对该第一路径的输出和该第二路径的输出执行逐像素加法。
[0020]在一些实施例中,该动态模块序列中的第一个动态模块动态地生成网格内核以应用于该退化图像的对应网格。
[0021]在一些实施例中,该退化图像是低分辨率图像,以及,该优化网络执行超分辨率操作以输出高分辨率图像。
[0022]在一些实施例中,该处理硬件还用于:在该特征提取网络中执行残差模块的操作,每个残差模块包括卷积层和修正线性单元(ReLU)层。
[0023]在一些实施例中,该处理硬件还用于:该动态模块序列中的至少一个动态模块生成通道维度被扩展r
×
r倍的上采样动态内核,其中,r是上采样率;以及,将该上采样动态内核与输入图像进行卷积,以将该输入图像上采样r
×
r倍。
[0024]在一些实施例中,每个动态模块是由差值度量训练的,该差值度量测量地面实况图像和该动态模块的输出之间的差值。
[0025]在一些实施例中,该退化估计指示该退化图像的不同区域中的退化,每个区域中的退化包括以下各项中的一项或多项:下采样、模糊和噪声。
[0026]在一些实施例中,每个对应网格包括一个或多个图像像素,该一个或多个图像像素共享并使用相同的网格内核。
[0027]本
技术实现思路
是通过示例的方式提供的,并非旨在限定本专利技术。本领域技术人员在阅读附图所示优选实施例的下述详细描述之后,可以毫无疑义地理解本专利技术的这些目的及其它目的。详细的描述将参考附图在下面的实施例中给出。
附图说明
[0028]通过阅读后续的详细描述以及参考附图所给的示例,可以更全面地理解本专利技术。
[0029]图1是根据本专利技术实施例示出的用于可变退化的统一动态卷积网络(Unified Dynamic Convolutional Network for Variational Degradation,UDVD)的框架的示意图。
[0030]图2是根据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于优化图像的方法,其特征在于,该方法包括:接收输入,该输入包括退化图像与该退化图像的退化估计联级后的输出数据;执行特征提取操作,以将预训练的权重应用于该输入,并生成特征图;以及,执行优化网络的操作,其中,该优化网络包括具有多个动态模块的动态模块序列,以及,一个或多个动态模块动态地生成网格内核,以应用于从该动态模块序列中的前一动态模块输出的中间图像的对应网格,其中,每个网格内核是基于该中间图像和该特征图生成的。2.如权利要求1所述的方法,其特征在于,该一个或多个动态模块中的每一个动态模块包括卷积层的第一路径和卷积层的第二路径,该第一路径对该中间图像和该特征图进行操作以生成对应的网格内核,该第二路径对该中间图像和该特征图进行操作以生成残差图像。3.如权利要求2所述的方法,其特征在于,该方法还包括:对该第一路径的输出和该第二路径的输出执行逐像素加法。4.如权利要求1所述的方法,其特征在于,该动态模块序列中的第一个动态模块动态地生成网格内核以应用于该退化图像的对应网格。5.如权利要求1所述的方法,其特征在于,该退化图像是低分辨率图像,以及,该优化网络执行超分辨率操作以输出高分辨率图像。6.如权利要求1所述的方法,其特征在于,执行特征提取操作的步骤进一步包括:执行残差模块的操作,每个残差模块包括卷积层和修正线性单元ReLU层。7.如权利要求1所述的方法,其特征在于,执行该优化网络的操作还包括:该动态模块序列中的至少一个动态模块生成通道维度被扩展r
×
r倍的上采样动态内核,其中,r是上采样率;以及,将该上采样动态内核与输入图像进行卷积,以将该输入图像上采样r
×
r倍。8.如权利要求1所述的方法,其特征在于,每个动态模块是由差值度量训练的,该差值度量测量地面实况图像和该动态模块的输出之间的差值。9.如权利要求1所述的方法,其特征在于,该退化估计指示该退化图像的不同区域中的退化,每个区域中的退化包括以下各项中的一项或多项:下采样、模糊和噪声。10.如权利要求1所述的方法,其特征在于,每个对应网格包括一个或多个图像像素,该一个或多个图像像素共享并使用相同的网格内核。11.一种用于实现优化图像的系统,该系统包括存储器和处理硬件,该存储器用于...

【专利技术属性】
技术研发人员:许毓轩曾瑀曾守曜郭玹凯蔡一民
申请(专利权)人:联发科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1