System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于扩散模型的遥感图像生成方法技术_技高网

一种基于扩散模型的遥感图像生成方法技术

技术编号:40497857 阅读:10 留言:0更新日期:2024-02-26 19:25
本发明专利技术提供一种基于扩散模型的遥感图像生成方法,属于遥感图像生成领域,首先进行前向扩散过程,生成训练数据集;其次进行反向去噪过程,不断去噪直至得到原始图像;然后计算后验概率,在给定加噪图像和原始图像的前提先得到去噪图像的概率分布;接着搭建深度学习模型,使用改进UNet模型预测反向去噪过程中的均值和方差;最后进行图像生成,随机生成噪声图像,经过循环去噪,生成遥感图像。本发明专利技术能够生成与天基遥感图像相似的光学遥感图像,且本发明专利技术同时预测均值和方差,提升了生成遥感图像中高频信息的占比。

【技术实现步骤摘要】

本专利技术属于遥感图像生成领域,更具体地涉及一种基于扩散模型的遥感图像生成方法


技术介绍

1、随着chatgpt、dalle、stable-diffusion等aigc(ai generated content,人工智能生成内容)模型的快速发展,人工智能算法具备了内容生成能力和创造能力,能够根据提示提示词(prompt)生成文本、图像、视频甚至三维模型,已经在文章摘要生成、文章扩写、文本润色、插画生成、智能对话等领域成功应用。然而,由于算法设计的局限和数据的稀缺,使得aigc模型在遥感、医疗、法律等领域还未得到广泛应用。

2、凭借扩散模型的稳定生成能力,图像生成智能算法已经能够根据用户的需求自动生成风景画、人物肖像画、二维码等图像,且画面十分清晰,但是,目前还不具备生成逼真遥感图像的能力,生成的遥感图像跟输入的提示词匹配程度很低。采用基于扩散模型的遥感图像生成方法能够兼顾遥感成像机理和遥感图像的特点,稳定生成逼真的遥感图像。


技术实现思路

1、本专利技术的目的是为了提高生成遥感图像与真实遥感图像的相似度,提出了一种基于扩散模型的遥感图像生成方法。

2、本专利技术采用的技术方案为:

3、一种基于扩散模型的遥感图像生成方法,包括以下步骤:

4、步骤1,进行前向扩散:通过逐步添加噪声,将原始的真实遥感图像加噪至纯噪声图像,用x0表示原始的真实遥感图像,xt表示进行了t步加噪之后的图像,加噪过程表示成下式:

5、

6、即在给定xt-1前提下得到xt的概率服从高斯分布,高斯分布的均值为方差为βti,i表示单位矩阵,根据高斯分布概率密度函数,将上式进一步表示为:

7、

8、式中,xt为xt-1和ε的线性组合,ε为高斯噪声,βt为噪声权重,随着t的增大,βt的值不断变大,当t=t时,xt为纯高斯噪声,t为最大加噪次数;

9、步骤2,进行反向去噪和计算后验概率;

10、反向去噪过程为:对于任意的随机纯高斯噪声xt,去噪后得到xt-1,不断去噪直至得到图像x0,第t步的去噪过程表示成下式:

11、

12、即在给定xt前提下得到xt-1的概率服从高斯分布,均值为μθ(xt,t),方差为σθ(xt,t),θ为深度学习模型的参数;

13、计算后验概率过程为:根据多变量条件概率的链式法则、贝叶斯公式以及高斯分布概率密度函数计算后验概率分布,后验概率分布表示为:

14、

15、即在给定xt和x0的前提下,得到的xt-1概率服从均值为方差为的高斯分布,其中式中

16、αt=1-βt;

17、步骤3,搭建深度学习模型:采用unet模型作为基础网络模型,在unet基础上设置输入尺寸与遥感图像尺寸一致,设置输出尺寸为四通道张量,前三个通道为模型预测的均值,第四个通道为模型预测的方差,损失函数设置为反向去噪过程高斯分布与后验概率高斯分布之间的kl散度;将前向扩散过程产生的数据作为训练数据,使用最优化算法对深度学习模型的参数θ进行训练,待训练收敛后得到训练好的深度学习模型;

18、步骤4,图像生成:随机生成高斯噪声图像xt,输入到训练好的深度学习模型中,经过模型预测出均值μθ(xt,t)和方差σθ(xt,t),根据采样公式在均值为μθ(xt,t)方差为σθ(xt,t)的高斯分布中采样得到xt-1,循环t次,直到得到x0,即为生成的遥感图像,采样公式如下:

19、

20、进一步的,步骤1中所述的高斯噪声ε服从标准高斯分布,即ε~n(0,1),噪声权重βt采用预设值,即t为最大加噪次数,t表示第t次加噪。

21、进一步的,步骤2中所述方差的最大值设置为2。

22、进一步的,步骤3中所述训练数据为前向扩散过程产生的序列数据,遍历数据集中的遥感图像,前向扩散过程进行了t步加噪,将每一步的加噪结果保存为序列数据,输入到深度学习模型中进行训练。

23、进一步的,步骤4中所述循环次数t设置为2500。

24、本专利技术相对于现有技术的优点为:

25、(1)本专利技术能够生成与天基遥感图像相似的光学遥感图像;

26、(2)本专利技术采用扩散模型,克服了现有的基于对抗神经网络的遥感图像生成模型训练不收敛的问题;

27、(3)本专利技术同时预测均值和方差,提升了生成遥感图像中高频信息的占比。

本文档来自技高网...

【技术保护点】

1.一种基于扩散模型的遥感图像生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于扩散模型的遥感图像生成方法,其特征在于,步骤1中所述的高斯噪声ε服从标准高斯分布,即ε~N(0,1),噪声权重βt采用预设值,即T为最大加噪次数,t表示第t次加噪。

3.根据权利要求1所述的一种基于扩散模型的遥感图像生成方法,其特征在于,步骤2中所述方差的最大值设置为2。

4.根据权利要求1所述的一种基于扩散模型的遥感图像生成方法,其特征在于,步骤3中所述训练数据为前向扩散过程产生的序列数据,遍历数据集中的遥感图像,前向扩散过程进行了T步加噪,将每一步的加噪结果保存为序列数据,输入到深度学习模型中进行训练。

5.根据权利要求1所述的一种基于扩散模型的遥感图像生成方法,其特征在于,步骤4中所述循环次数T设置为2500。

【技术特征摘要】

1.一种基于扩散模型的遥感图像生成方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于扩散模型的遥感图像生成方法,其特征在于,步骤1中所述的高斯噪声ε服从标准高斯分布,即ε~n(0,1),噪声权重βt采用预设值,即t为最大加噪次数,t表示第t次加噪。

3.根据权利要求1所述的一种基于扩散模型的遥感图像生成方法,其特征在于,步骤2中所述方差的最大值...

【专利技术属性】
技术研发人员:张晓男王港孙康常晓宇
申请(专利权)人:中国电子科技集团公司第五十四研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1