一种基于近端策略优化的图像美化方法及装置制造方法及图纸

技术编号:39261807 阅读:13 留言:0更新日期:2023-10-30 12:14
本发明专利技术公开了一种基于近端策略优化的图像美化方法及装置,方法包括:构建CLIP模型的文本和图像编码模块,将全量渲染图输入图像编码模块,确定初始数据集;构建初始深度强化学习网络,将初始数据集输入初始深度强化学习网络,结合近端策略优化完成初始深度强化学习网络的训练,得到目标深度强化学习网络,将待美化图像通过目标深度强化学习网络,得到美化后的图像;本发明专利技术通过构建CLIP模型的文本和图像编码模块,在深度强化学习网络的训练过程中可以提高训练效率,还通过构建深度强化学习网络,多种算法对图像进行美化,解决了传统的数字图像处理方法只能处理单一图像缺陷的问题,提高了方法的泛化性,可广泛应用于图像处理技术领域。术领域。术领域。

【技术实现步骤摘要】
一种基于近端策略优化的图像美化方法及装置


[0001]本专利技术涉及图像处理
,尤其是一种基于近端策略优化的图像美化方法及装置。

技术介绍

[0002]图像美化技术是一种将低质量图像(Low)增强为高质量图像(High Resolution,HR)的图像编辑技术,在社会的各个行业存在着广泛的应用,如:人像美化,手机图像美化,旧照修复等。
[0003]主流的图像美化方法主要基于三类。第一类是基于传统数字图像处理的方法,如ISP中的曝光调整、黑电平方法、白平衡方法、色彩矫正等;还有类似于基于图像直方图的CLAHE方法等。传统数字图像处理方法在针对性地处理某些特定类型的图像缺陷时有比较出色的效果,但缺乏泛化性,每次处理都需要专业人士进行超参数的调整。
[0004]第二类是基于LUT的方法,这类方法在摄影、影视等领域被大规模应用,通过自身积累的LUTs模板可以获得一个出色的图像处理效果,但同样缺乏泛化性,每张图片能采用的LUT各不相同。
[0005]第三类是基于深度学习的方法,通过收集类似于FIVE5K这样的图像美化数据集,结合有监督训练方法,获得一种较为具有泛化性的图像美化方法,但这类方法往往都需要有pair数据集;还有一些利用GAN技术,不需要pair数据也可以完成,但这类方法往往难以训练,虽然具备一定的泛化性能,但由于主流的数据集往往从摄影、影视等领域获取,导致相关的模型偏向于这类数据的拟合,这与室内家居渲染领域有比较大的差异,并不能有效地在家居渲染领域有很好的具备泛化性的效果。
[0006]现有技术主要存在以下问题:
[0007]1、传统的数字图像处理方法只能处理单一图像缺陷,且缺乏泛化性;
[0008]2、基于LUT的方法同样缺乏泛化性;
[0009]3、基于深度学习的方法需要GAN提供图像状态奖励,引入GAN和ActorCritic模型的话,导致难以训练,同时耗费更多的计算资源。

技术实现思路

[0010]有鉴于此,本专利技术实施例提供一种效率高且泛化性强的基于近端策略优化的图像美化方法。
[0011]一方面,本专利技术实施例提供了一种基于近端策略优化的图像美化方法,包括:
[0012]构建CLIP模型的文本编码模块和图像编码模块;
[0013]通过将图像评价文本输入所述文本编码模块得到文本特征向量;
[0014]通过所述图像编码模块提取全量渲染图的渲染图像特征,基于所述渲染图像特征与所述文本特征向量计算所述全量渲染图的场景复杂度,将所述场景复杂度与预设的第一阈值进行对比,将所述场景复杂度大于所述第一阈值的渲染图确定为初始数据集;
[0015]构建初始深度强化学习网络;
[0016]将所述初始数据集输入所述初始深度强化学习网络,通过近端策略优化完成所述初始深度强化学习网络的训练,得到目标深度强化学习网络;
[0017]将待美化图像输入所述图像编码模块,得到待美化特征向量,将所述待美化特征向量输入所述目标深度强化学习网络进行图像美化,得到美化后的图像。
[0018]可选地,所述通过将图像评价文本输入所述文本编码模块得到文本特征向量,包括:
[0019]将第一质量图像文本输入所述文本编码模块,得到第一质量文本特征向量,其中所述第一质量图像文本为高质量图像文本;
[0020]将第二质量图像文本输入所述文本编码模块,得到第二质量文本特征向量,其中所述第二质量图像文本为低质量图像文本;
[0021]将第一场景文本输入所述文本编码模块,得到第一场景文本特征向量,其中所述第一场景文本为复杂场景文本;
[0022]将第二场景文本输入所述文本编码模块,得到第二场景文本特征向量,其中所述第二场景文本为简单场景文本。
[0023]可选地,所述通过所述图像编码模块提取全量渲染图的渲染图像特征,基于所述渲染图像特征与所述文本特征向量计算所述全量渲染图的场景复杂度,将所述场景复杂度与预设的第一阈值进行对比,将所述场景复杂度大于所述第一阈值的渲染图确定为初始数据集,包括:
[0024]获取全量渲染图,将所述全量渲染图进行预处理后输入所述图像编码模块,提取所述全量渲染图的渲染图像特征;
[0025]将所述渲染图像特征与所述第一场景文本特征向量、所述第二场景文本特征向量,通过向量点乘计算得到第一场景相似度和第二场景相似度;
[0026]将所述第一场景相似度和所述第二场景相似度通过激活处理,计算得到场景复杂度;
[0027]将所述场景复杂度与预设的第一阈值进行对比,将所述场景复杂度大于所述第一阈值的渲染图确定为初始数据集。
[0028]可选地,所述构建初始深度强化学习网络,包括:
[0029]构建离散的图像处理选择动作模块,所述图像处理选择动作模块包括三个感知层,感知层之间通过TANH激活,输出采用SIGMOID激活;
[0030]构建连续的图像处理参数动作模块,所述图像处理参数动作模块包括三个感知层,感知层之间通过TANH激活,输出采用TANH激活;
[0031]构建评估价值函数模块,所述评估价值函数模块包括三个感知层,感知层之间通过TANH激活;
[0032]根据所述图像处理选择动作模块、所述图像处理参数动作模块和所述评估价值函数模块构建初始深度强化学习网络。
[0033]可选地,所述将所述初始数据集输入所述初始深度强化学习网络,通过近端策略优化完成所述初始深度强化学习网络的训练,得到目标深度强化学习网络,包括:
[0034]将所述初始数据集通过所述图像编码模块,获得第一图像特征;
[0035]将所述第一图像特征与第一质量文本特征向量、第二质量文本特征向量进行计算,得到第一相似度得分和第二相似度得分;
[0036]将所述第一相似度得分和所述第二相似度得分进行激活处理,得到第一质量得分;
[0037]将所述第一图像特征输入所述图像处理选择动作模块,得到选择动作概率;
[0038]将所述第一图像特征输入所述图像处理参数动作模块,得到参数动作均值;
[0039]将所述第一图像特征输入所述评估价值函数模块,得到价值评估分数;
[0040]将所述全量渲染图通过所述图像编码模块,获得第二图像特征;
[0041]将所述第二图像特征与第一质量文本特征向量、第二质量文本特征向量进行计算,得到第三相似度得分和第四相似度得分;
[0042]将所述第三相似度得分和所述第四相似度得分进行激活处理,得到第二质量得分;
[0043]将所述第一质量得分与所述第二质量得分作差得到奖赏得分;
[0044]基于所述选择动作概率、所述参数动作均值、所述价值评估分数和所述奖赏得分完成所述初始深度强化学习网络的训练,
[0045]可选地,所述方法还包括:构建图像处理算法库和图像处理LUT包;在将待美化图像通过所述目标深度强化学习网络时,调用所述图像处理算法库和所述图像处理LUT包本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于近端策略优化的图像美化方法,其特征在于,包括:构建CLIP模型的文本编码模块和图像编码模块;通过将图像评价文本输入所述文本编码模块得到文本特征向量;通过所述图像编码模块提取全量渲染图的渲染图像特征,基于所述渲染图像特征与所述文本特征向量计算所述全量渲染图的场景复杂度,将所述场景复杂度与预设的第一阈值进行对比,将所述场景复杂度大于所述第一阈值的渲染图确定为初始数据集;构建初始深度强化学习网络;将所述初始数据集输入所述初始深度强化学习网络,通过近端策略优化完成所述初始深度强化学习网络的训练,得到目标深度强化学习网络;将待美化图像输入所述图像编码模块,得到待美化特征向量,将所述待美化特征向量输入所述目标深度强化学习网络进行图像美化,得到美化后的图像。2.根据权利要求1所述的一种基于近端策略优化的图像美化方法,其特征在于,所述通过将图像评价文本输入所述文本编码模块得到文本特征向量,包括:将第一质量图像文本输入所述文本编码模块,得到第一质量文本特征向量,其中所述第一质量图像文本为高质量图像文本;将第二质量图像文本输入所述文本编码模块,得到第二质量文本特征向量,其中所述第二质量图像文本为低质量图像文本;将第一场景文本输入所述文本编码模块,得到第一场景文本特征向量,其中所述第一场景文本为复杂场景文本;将第二场景文本输入所述文本编码模块,得到第二场景文本特征向量,其中所述第二场景文本为简单场景文本。3.根据权利要求2所述的一种基于近端策略优化的图像美化方法,其特征在于,所述通过所述图像编码模块提取全量渲染图的渲染图像特征,基于所述渲染图像特征与所述文本特征向量计算所述全量渲染图的场景复杂度,将所述场景复杂度与预设的第一阈值进行对比,将所述场景复杂度大于所述第一阈值的渲染图确定为初始数据集,包括:获取全量渲染图,将所述全量渲染图进行预处理后输入所述图像编码模块,提取所述全量渲染图的渲染图像特征;将所述渲染图像特征与所述第一场景文本特征向量、所述第二场景文本特征向量,通过向量点乘计算得到第一场景相似度和第二场景相似度;将所述第一场景相似度和所述第二场景相似度通过激活处理,计算得到场景复杂度;将所述场景复杂度与预设的第一阈值进行对比,将所述场景复杂度大于所述第一阈值的渲染图确定为初始数据集。4.根据权利要求1所述的一种基于近端策略优化的图像美化方法,其特征在于,所述构建初始深度强化学习网络,包括:构建离散的图像处理选择动作模块,所述图像处理选择动作模块包括三个感知层,感知层之间通过TANH激活,输出采用SIGMOID激活;构建连续的图像处理参数动作模块,所述图像处理参数动作模块包括三个感知层,感知层之间通过TANH激活,输出采用TANH激活;构建评估价值函数模块,所述评估价值函数模块包括三个感知层,感知层之间通过
TANH激活;根据所述图像处理选择动作模块、所述图像处理参数动作模块和所述评估价值函数模块构建初始深度强化学习网络。5.根据权利要求4所述的一种基于近端策略优化的图像美化方法,其特征在于,所述将所述初始数据集输入所述初始深度强化学习网络,通过近端策略优化完成所述初始深度强化学习网络的训练,得到目标深度强化学习网络,包括:将所述初始数据集通过所述图像编码模块,获得第一图像特征;将所述第一图像特征与第一质量...

【专利技术属性】
技术研发人员:戴振军王兵柯建生陈学斌
申请(专利权)人:广州极点三维信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1