去噪扩散隐式模型的反转方法、电子设备和存储介质技术

技术编号：43949128 阅读：22 留言：0更新日期：2025-01-07 21:37

本发明专利技术公开一种去噪扩散隐式模型的反转方法、电子设备和存储介质，在不需要进行任何训练的情况下，以不增加计算开销的方式，优化去噪扩散隐式模型的反转过程。在总的去噪步数以内：在特定时间步区间内，将上一时间步的加权潜变量与当前时间步的潜变量进行加权相加得到加权潜变量；在特定时间步区间以外，仅使用DDIM Inversion对进行反转。本发明专利技术主要通过在特定时间步区间内加权相加该时间步的潜变量以及上一时间步的潜变量，由此来改善反转质量，并且没有额外的计算开销，只需稍微增加内存消耗即可，从而实现了以不增加计算开销的方式优化去噪扩散隐式模型的反转过程。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于深度学习中文本到图像生成任务的的下游任务，可以将文生图技术应用于真实图像编辑的，特别是指一种去噪扩散隐式模型的反转方法、电子设备和存储介质。

技术介绍

1、近年来，去噪扩散隐式模型发展迅猛，在诸如动漫、视觉艺术等领域得到应用。此类模型可以根据用户输入的一系列提示词生成高质量的图像，比起人工作画，其速度大为提升的同时质量也毫不逊色。因此，利用去噪扩散隐式模型进行真实图像编辑的想法应运而生。一般而言，此类模型从一个初始噪声开始，在提示词的引导下对噪声进行逐步的去噪，生成最终的图像结果。那么，要将其用于真实图像编辑，首先要做的就是对于任意一个去噪扩散隐式模型，找到任意一张真实图像所对应的初始噪声，这一初始噪声在经过去噪扩散隐式模型进行去噪后，得到的图像结果就是该真实图像，而找到真实图像所对应的初始噪声的过程被称为去噪扩散隐式模型的反转。

2、现有技术面临的问题是：最早提出的反转方法是直接利用模型的去噪噪声作为加噪噪声，这样做的结果就是不可避免地产生较大的误差；后来的改进方法则大多是通过迭代优化的方式，反复生成加噪噪声...

【技术保护点】

1.一种去噪扩散隐式模型的反转方法，其特征在于在总的去噪步数以内，按不同的时间步区间分别执行：

2.一种电子设备，其特征在于：

3.一种计算机可读存储介质，其特征在于：

【技术特征摘要】

1.一种去噪扩散隐式模型的反转方法，其特征在于在总的去噪步数以内，按不同的时间步区间分别执行：<...

【专利技术属性】
技术研发人员：纪荣嵘，张子岳，林明宝，
申请(专利权)人：厦门大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人