一种图像修补方法及装置、一种电子设备制造方法及图纸

技术编号：39995778 阅读：4 留言：0更新日期：2024-01-09 02:45

本发明专利技术提供一种图像修补方法，包括：获取配对条件‑图像数据集和大规模图文配对数据集；获取预训练隐变量扩散生成模型；构建条件控制网络，所述条件控制网络与预训练隐变量扩散生成模型同构；基于配对条件‑图像数据集训练条件控制网络，获得训练好的条件控制网络；根据大规模图文配对数据集，基于预训练隐变量扩散生成模型，微调训练得到隐变量扩散修补模型；基于条件控制网络和隐变量扩散修补模型，生成待修补区域图像；基于符号距离场SDF构建平滑权重图，将所述待修补区域图像融合至原图像中；输出完成修补的图像。本发明专利技术还包括对应的图像修补装置和电子设备。本发明专利技术的方案能够输出高保真的修补图像，计算开销小。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像处理领域，尤其涉及一种图像修补方法及装置。

技术介绍

1、图像修补是人工智能图像处理领域其中一个分支，可以通过自然语言描述限定以处理相应的图像，实现一定程度上对模型生成内容的控制。

2、近年来，得益于算力的发展和大数据的累积，通过自然语音控制修补图像的效果已经与画师相差无几，部分图像处理模型的输出效果甚至超越了画师的水平，另一方面，图像修补技术的迅猛发展也基于扩散生成模型这项技术的突破。

3、然而，仅仅依靠自然语言的描述来生成一张完整的图像，仍然具有大量的不可控因素，此外，在实际的设计生产类工作中，往往需要在各个图层、文字、特效及其的组合中，对整体图像的局部进行多次调整，才能够输出一个完整的图像，调整图像参数的过程冗长。因此，需要在扩散模型的生成过程中导入更多、更完整的控制因素，以提升图像处理的能力，可以进一步促进当前扩散生成模型技术的应用与落地。

4、图像修补领域目前还存在部分缺陷：(1)基于扩散生成模型的算法主要输入仍为自然语言文本，无法做到对画面布局、人体姿态、物体轮廓、物体间相对位置、局部重绘等方面高精细度控制，限制了其实际应用的场景；(2)基于扩散生成模型或是传统算法、深度学习算法等处理手段修补的图像会存在一些过渡、融合不自然的瑕疵，这往往还需要一些特殊后处理操作才能在一定程度上修复，但问题仍然存在，并且以隐变量扩散模型为代表的图像修补算法，还会导致不需要修补的图像区域出现失真的现象。

5、基于以上，本申请提供了解决以上技术问题的技术方案。