一种基于近端策略优化的图像美化方法及装置制造方法及图纸

技术编号：39261807 阅读：13 留言：0更新日期：2023-10-30 12:14

本发明专利技术公开了一种基于近端策略优化的图像美化方法及装置，方法包括：构建CLIP模型的文本和图像编码模块，将全量渲染图输入图像编码模块，确定初始数据集；构建初始深度强化学习网络，将初始数据集输入初始深度强化学习网络，结合近端策略优化完成初始深度强化学习网络的训练，得到目标深度强化学习网络，将待美化图像通过目标深度强化学习网络，得到美化后的图像；本发明专利技术通过构建CLIP模型的文本和图像编码模块，在深度强化学习网络的训练过程中可以提高训练效率，还通过构建深度强化学习网络，多种算法对图像进行美化，解决了传统的数字图像处理方法只能处理单一图像缺陷的问题，提高了方法的泛化性，可广泛应用于图像处理技术领域。术领域。术领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于近端策略优化的图像美化方法及装置

[0001]本专利技术涉及图像处理
，尤其是一种基于近端策略优化的图像美化方法及装置。

技术介绍

[0002]图像美化技术是一种将低质量图像(Low)增强为高质量图像(High Resolution，HR)的图像编辑技术，在社会的各个行业存在着广泛的应用，如：人像美化，手机图像美化，旧照修复等。
[0003]主流的图像美化方法主要基于三类。第一类是基于传统数字图像处理的方法，如ISP中的曝光调整、黑电平方法、白平衡方法、色彩矫正等；还有类似于基于图像直方图的CLAHE方法等。传统数字图像处理方法在针对性地处理某些特定类型的图像缺陷时有比较出色的效果，但缺乏泛化性，每次处理都需要专业人士进行超参数的调整。
[0004]第二类是基于LUT的方法，这类方法在摄影、影视等领域被大规模应用，通过自身积累的LUTs模板可以获得一个出色的图像处理效果，但同样缺乏泛化性，每张图片能采用的LUT各不相同。
[0005]第三类是基于深度学习的方法，通过收集类似于FIVE5K这样的图像美化数据集，结合有监督训练方法，获得一种较为具有泛化性的图像美化方法，但这类方法往往都需要有pair数据集；还有一些利用GAN技术，不需要pair数据也可以完成，但这类方法往往难以训练，虽然具备一定的泛化性能，但由于主流的数据集往往从摄影、影视等领域获取，导致相关的模型偏向于这类数据的拟合，这与室内家居渲染领域有比较大的差异，并不能有效地在家居渲染领域有很好的具备泛化性的效果。
...

【技术保护点】

【技术特征摘要】
1.一种基于近端策略优化的图像美化方法，其特征在于，包括：构建CLIP模型的文本编码模块和图像编码模块；通过将图像评价文本输入所述文本编码模块得到文本特征向量；通过所述图像编码模块提取全量渲染图的渲染图像特征，基于所述渲染图像特征与所述文本特征向量计算所述全量渲染图的场景复杂度，将所述场景复杂度与预设的第一阈值进行对比，将所述场景复杂度大于所述第一阈值的渲染图确定为初始数据集；构建初始深度强化学习网络；将所述初始数据集输入所述初始深度强化学习网络，通过近端策略优化完成所述初始深度强化学习网络的训练，得到目标深度强化学习网络；将待美化图像输入所述图像编码模块，得到待美化特征向量，将所述待美化特征向量输入所述目标深度强化学习网络进行图像美化，得到美化后的图像。2.根据权利要求1所述的一种基于近端策略优化的图像美化方法，其特征在于，所述通过将图像评价文本输入所述文本编码模块得到文本特征向量，包括：将第一质量图像文本输入所述文本编码模块，得到第一质量文本特征向量，其中所述第一质量图像文本为高质量图像文本；将第二质量图像文本输入所述文本编码模块，得到第二质量文本特征向量，其中所述第二质量图像文本为低质量图像文本；将第一场景文本输入所述文本编码模块，得到第一场景文本特征向量，其中所述第一场景文本为复杂场景文本；将第二场景文本输入所述文本编码模块，得到第二场景文本特征向量，其中所述第二场景文本为简单场景文本。3.根据权利要求2所述的一种基于近端策略优化的图像美化方法，其特征在于，所述通过所述图像编码模块提取全量渲染图的渲染图像特征，基于所述渲染图像特征与所述文本特征向量计算所述全量渲染图的场景复杂度，将所述场景复杂度与预设的第一阈值进行对比，将所述场景复杂度大于所述第一阈值的渲染图确定为初始数据集，包括：获取全量渲染图，将所述全量渲染图进行预处理后输入所述图像编码模块，提取所述全量渲染图的渲染图像特征；将所述渲染图像特征与所述第一场景文本特征向量、所述第二场景文本特征向量，通过向量点乘计算得到第一场景相似度和第二场景相似度；将所述第一场景相似度和所述第二场景相似度通过激活处理，计算得到场景复杂度；将所述场景复杂度与预设的第一阈值进行对比，将所述场景复杂度大于所述第一阈值的渲染图确定为初始数据集。4.根据权利要求1所述的一种基于近端策略优化的图像美化方法，其特征在于，所述构建初始深度强化学习网络，包括：构建离散的图像处理选择动作模块，所述图像处理选择动作模块包括三个感知层，感知层之间通过TANH激活，输出采用SIGMOID激活；构建连续的图像处理参数动作模块，所述图像处理参数动作模块包括三个感知层，感知层之间通过TANH激活，输出采用TANH激活；构建评估价值函数模块，所述评估价值函数模块包括三个感知层，感知层之间通过
TANH激活；根据所述图像处理选择动作模块、所述图像处理参数动作模块和所述评估价值函数模块构建初始深度强化学习网络。5.根据权利要求4所述的一种基于近端策略优化的图像美化方法，其特征在于，所述将所述初始数据集输入所述初始深度强化学习网络，通过近端策略优化完成所述初始深度强化学习网络的训练，得到目标深度强化学习网络，包括：将所述初始数据集通过所述图像编码模块，获得第一图像特征；将所述第一图像特征与第一质量...

【专利技术属性】
技术研发人员：戴振军，王兵，柯建生，陈学斌，
申请(专利权)人：广州极点三维信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人