一种基于LDM-PNN和粒子群算法的超原子逆向设计方法技术

技术编号:39157796 阅读:10 留言:0更新日期:2023-10-23 15:01
本发明专利技术实施公开了一种基于LDM

【技术实现步骤摘要】
一种基于LDM

PNN和粒子群算法的超原子逆向设计方法


[0001]本专利技术属于超原子表面结构设计
,特别涉及一种基于LDM

PNN和粒子群算法的超原子逆向设计方法。

技术介绍

[0002]超材料是指非天然的、由特定的空间排布结构组成的人工复合材料,且相比于天然材料,它具备超常的物理特性,而超表面是超材料的二维(2D)版本,是由亚波长结构组成的平面器件,也被称为超原子。
[0003]为了制备具有所需光学性质的超表面结构,必须精确预测和设计超原子的光谱响应和几何形状。从光谱响应(SR)到超原子的逆向设计是一个从低维到高维的难题,两者之间的复杂关系无法通过广义理论建立简单的映射关系来解决,并且逆向设计还存在不同的超原子结构可能会产生非常相似的光谱响应的“一对多”的映射问题。然而传统的设计方法只能依赖于经验推理或实验试错,由于这种方法涉及大量的全波数值模拟(例如,时域有限差分法(FDTD)和有限分量法(FEM)),因此设计效率低且结果通常不令人满意,使用这类方法进行超原子的逆向设计会花费大量的人力成本和时间。
[0004]专利号CN202210839542.2公开了“一种基于改进生成对抗网络的超表面单元结构逆设计方法”,这种设计方法将数据集分组输入生成器模型G和鉴别器模型D进行模型的训练。该超表面单元结构逆设计方法通过电磁响应得到符合电磁响应的超表面单元结构,减少了设计超表面单元结构的试错时间,大幅度提升了设计效率。但是,这种超表面逆向设计方法利用的是生成对抗网络,生成对抗网络的训练过程不稳定,训练还会遭遇梯度消失,且无法解决“一对多”的映射问题。
[0005]专利号CN202011160881.5公开了“一种利用级联深度神经网络的介质超表面逆向设计算法”,这种设计方法利用包含结构信息的图片作为输入、电磁响应作为输出训练,训练编解码器用于包含结构信息图片的降维和特征提取。级联深度神经网络的正向网络实现介质超表面响应单元透射谱的快速预测和针对性的逆向设计,大大节省设计的时间成本和计算力。但是,这种逆向设计方法也没法解决“一对多”的映射问题。
[0006]因此,亟需设计一种能够预测超原子的光谱响应、通过给定光谱响应搜寻最优超原子结构、节约人力时间和成本、解决“一对多”的映射问题的逆向设计。
[0007]公开于该
技术介绍
部分的信息仅仅旨在增加对本专利技术的总体背景的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域一般技术人员所公知的现有技术。

技术实现思路

[0008]本专利技术的目的在于提供一种基于LDM

PNN和粒子群算法的超原子逆向设计方法,通过将前向预测模型和优化算法结合,利用粒子群算法在基于LDM模型编解码的潜在空间中搜寻全局最优超原子,从而克服上述现有技术中的缺陷。
[0009]为实现上述目的,本专利技术提供了一种基于LDM

PNN和粒子群算法的超原子逆向设
计方法,其步骤为:
[0010]S01、确定超原子的结构信息参数,使用现有数据集训练LDM模型;训练LDM模型中的编解码器,编解码器包括编码器M和解码器D,编解码器提供低维的潜在空间来训练扩散模型diffusion models;
[0011]S02、LDM模型训练完成后,超原子结构图像通过LDM模型中的编码器M将数据从高维空间编码压缩到低维空间,即潜在空间,在潜在空间中形成潜在特征向量;将编码后的超原子结构图像和结构参数一起输入到LDM模型的扩散模型中,经过扩散模型扩散后在潜在空间中生成由超原子结构图像和结构参数组成的超原子结构信息参数;解码器D再将超原子结构图像解码恢复到原始的高维空间;
[0012]S03、通过现有数据集对PNN模型进行训练,模型训练完成后,将解码后的超原子结构图像和结构参数输入到PNN模型中,预测超原子结构一一对应的光谱响应透射系数的实部和虚部;
[0013]S04、给定目标光谱响应透射系数,通过粒子群算法在潜在空间中寻找对应的最优超原子,最优超原子的光谱响应透射系数误差小于阈值;如果找到最优超原子,则输出超原子结构图像和结构参数;否则,由粒子群算法更新结构信息参数;通过LDM模型中的解码器D解码后输入到PNN模型中;重复此类操作,直到找到近似最优解或达到指定的迭代次数;
[0014]优选地,技术方案中,步骤S01中,现有数据集是由全电介质超原子的结构信息参数及其对应的光谱响应透射系数的实部和虚部组成;超原子的结构信息参数包括2D结构图像和三个一维结构参数,其中2D结构图像是高折射率介电组件的俯视图,俯视图为64*64像素组成的图像,三个一维结构参数为结构折射率、厚度和结构的尺寸;现有数据集中,超原子是由具有不同折射率的两层介电组件堆叠而成,其中底层是正方形的低折射率介电组件,上层是任意对称形状的高折射率介电组件。
[0015]优选地,技术方案中,步骤S02中,LDM模型分为两个部分:编解码器D和扩散模型,其中,编解码器也分为编码器M和解码器D,编码器M是将超原子结构图像编码压缩为低维的图像,而解码器D是将低维的图像还原成超原子结构图像,编解码D训练的损失函数为重构项损失函数loss
re
,即输入超原子结构图像和重构超原子结构图像的均方误差,loss
re
为:
[0016][0017]其中,x为重构的超原子结构图像,为输入的超原子结构图像。
[0018]优选地,技术方案中,步骤S02中,扩散模型diffusion models的扩散过程分为前向扩散过程和反向扩散过程;前向扩散过程为:
[0019][0020][0021]α
t
=1

β
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4);
[0022]其中,x0表示原始超原子结构图像,x
t
表示第t步添加噪声后得到的超原子结构图像,q(x
t
\x0)表示以x0为均值的高斯分布,α
t
为过渡函数值,β
t
为高斯分布的方差,0<β
t
<1,N为正态分布,为α
t
从时间步长1到t的累积值,为正态分布的均值和,为正态分布的方差,∈
t
为在时间步长t时的服从N(0,1)的高斯噪声;x
t
从高斯分
布中采样得到且服从正态分布t∈[1,T],[1,T]是一系列固定的值;
[0023]前向扩散过程是在原始超原子结构图像x0上逐步添加噪声,且每一步得到的超原子结构图像x
t
只和上一步超原子结构图像x
t
‑1相关,直至第T步变为纯高斯噪声x
T
的过程。
[0024]优选地,技术方案中,反向扩散过程是对给定的纯高斯噪声x
T
通过逐步去噪,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于LDM

PNN和粒子群算法的超原子逆向设计方法,其步骤为:S01、确定超原子的结构信息参数,使用现有数据集训练LDM模型;训练LDM模型中的编解码器,编解码器包括编码器M和解码器D,编解码器提供低维的潜在空间来训练扩散模型;S02、LDM模型训练完成后,超原子结构图像通过LDM模型中的编码器M将数据从高维空间编码压缩到低维空间,即潜在空间,在潜在空间中形成潜在特征向量;将编码后的超原子结构图像和结构参数一起输入到LDM模型的扩散模型中,经过扩散模型扩散后在潜在空间中生成由超原子结构图像和结构参数组成的超原子结构信息参数;解码器D再将超原子结构图像解码恢复到原始的高维空间;S03、通过现有数据集对PNN模型进行训练,模型训练完成后,将解码后的超原子结构图像和结构参数输入到PNN模型中,预测超原子结构一一对应的光谱响应透射系数的实部和虚部;S04、给定目标光谱响应透射系数,通过粒子群算法在潜在空间中寻找对应的最优超原子,最优超原子的光谱响应透射系数误差小于阈值;如果找到最优超原子,则输出超原子结构图像和结构参数;否则,由粒子群算法更新结构信息参数;通过LDM模型中的解码器D解码后输入到PNN模型中;重复此类操作,直到找到近似最优超原子或达到指定的迭代次数。2.根据权利要求1所述的基于LDM

PNN和粒子群算法的超原子逆向设计方法,其特征在于:步骤S01中,现有数据集是由全电介质超原子的结构信息参数及其对应的光谱响应透射系数的实部和虚部组成。超原子的结构信息参数为:2D结构图像和三个一维结构参数,其中2D结构图像是高折射率介电组件的俯视图,俯视图为64*64像素组成的图像,而三个一维结构参数为结构折射率、厚度和结构的尺寸;现有数据集中,超原子是由具有不同折射率的两层介电组件堆叠而成,其中底层是正方形的低折射率介电组件,上层是任意对称形状的高折射率介电组件。3.根据权利要求2所述的一种基于LDM

PNN和粒子群算法的超原子逆向设计方法,其特征在于:步骤S02中,LDM模型分为两个部分:编解码器D和扩散模型,其中,编解码器也分为编码器M和解码器D,编码器M是将超原子结构图像编码压缩为低维的图像,而解码器D是将低维的图像还原成超原子结构图像,编解码器训练的损失函数为重构项损失函数loss
re
,即输入超原子结构图像和重构超原子结构图像的均方误差,loss
re
为:其中,x为重构的超原子结构图像,为输入的超原子结构图像。4.根据权利要求3所述的一种基于LDM

PNN和粒子群算法的超原子逆向设计方法,其特征在于:步骤S02中,扩散模型的扩散过程分为前向扩散过程和反向扩散过程;前向扩散过程为:程为:α
t
=1

β
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4);其中,x0表示原始超原子结构图像,x
t
表示第t步添加噪声后得到的超原子结构图像,q(x
t
\x0)表示以x0为均值的高斯分布,α
t
为过渡函数值,β
t
为高斯分布的方差,0<β
t
<1,N为
正态分布,为α
t
从时间步长1到t的累积值,为正态分布的均值和,为正态分布的方差,∈
t
为在时间步长t时的服从N(0,1)的高斯噪声;x
t
从高斯分布中采样得到且服从正态分布t∈[1,T],[1,T]是一系列固定的值;前向扩散过程是在原始超原子结构图像x0上逐步添加噪声,且每一步得到的超原子结构图像x
t
只和上一步超原子结构图像x
t
‑1相关,直至第T步变为纯高斯噪声x
T
的过程;反向扩散过程是对给定的纯高斯噪声x
T
通过逐步去噪,直至最终恢复为原始超原子结构图像x0的过程;反向扩散过程为:的过程;反向扩散过程为:其中,z为服从N(0,1)的高斯噪声,∈
t
(x
t
,t)为预测噪声;∈
t<...

【专利技术属性】
技术研发人员:朱路花伟王靖智吕聪黄德昌
申请(专利权)人:华东交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1