基于变分原理的面向神经算子训练与偏微分方程组求解的统一方法、介质及产品技术

技术编号:38257034 阅读:18 留言:0更新日期:2023-07-27 10:19
一种基于变分原理的面向神经算子训练与偏微分方程组求解的统一方法、介质及产品,包括:从偏微分方程组的参数空间中抽样形成仅含离散参数场的数据集,划分为偏移集、测试集、无标签集,将无标签集分为多个批次,并形成边界条件的掩码张量;使用神经算子模块预测无标签集中离散参数场样本的节点解,得到离散化的泛函作为系统泛函的估计;计算泛函估计关于节点解的梯度,将其范数作为最小化目标,获取当前节点解的更新步长,更新模块的权重。本发明专利技术将求解偏微分方程组算子和训练神经算子两个任务统一在一个框架内完成,引入变分操作构建无标签的优化目标以替代数据驱动的训练误差项,节省生成用于构建数据驱动误差项所需的大量标签的时间与算力。标签的时间与算力。标签的时间与算力。

【技术实现步骤摘要】
基于变分原理的面向神经算子训练与偏微分方程组求解的统一方法、介质及产品


[0001]本专利技术属于物理仿真与机器学习的交叉领域,尤其涉及一种基于变分原理的面向神经算子训练与偏微分方程组求解的统一方法、介质及产品。

技术介绍

[0002]神经算子作为一种能够有效学习偏微分方程组的参数空间与解空间之间映射算子的深度神经网络,相对于高斯过程模型、径向基函数模型等传统的代理模型,能够对整个偏微分方程组求解域进行较高精度的即时推理,在流体、固体、电磁、传热等诸多物理仿真领域受到广泛关注。神经算子具有潜在超分辨性、高度的灵活性与优良的泛化性能等诸多优点,在工业装备数字孪生、实时与大规模仿真解算、动漫游戏建模渲染、元宇宙等行业具有巨大的落地空间,非常可能成为下一代物理仿真求解器的核心技术。
[0003]然而,现有针对神经算子的基于数据驱动的训练方法需要来自传统求解器的海量标签数据,导致对传统求解器的大量使用,从而带来巨大的计算负担。此外,训练过程本身也会带来一定的计算成本。

技术实现思路

[0004]针对现有基于数据驱动的训练神经算子方法的不足,本专利技术提出一种基于变分原理的面向神经算子训练与偏微分方程组求解的统一方法、介质及产品,通过神经算子的预测节点解估计离散的泛函,并通过基于方程组的迭代法最小化利用自动微分技术得到的离散泛函对节点解的梯度范数,构建无标签的优化目标来训练神经算子,从而避免大量地使用传统求解器获得标签,节约了计算成本。同时,本方法利用神经算子的泛化能力为每步迭代提供良好的初始解,本质上将训练与求解纳入了一个统一的框架。
[0005]为了达到上述目的,本专利技术采用的技术方案如下:
[0006]第一方面,一种基于变分原理的面向神经算子训练与偏微分方程组求解的统一方法,包括以下步骤:
[0007]步骤100:从偏微分方程组的参数空间中抽样形成无标签的仅含离散参数场的数据集D,将数据集D划分为偏移集L、测试集T和无标签集U,将无标签集U分为多个批次,对边界条件进行编码,形成边界条件的掩码张量(the mask tensor),包括以下子步骤:
[0008]步骤101:选定偏微分方程组的参数空间的形式和抽样策略;
[0009]步骤102:对偏微分方程组的求解域进行网格划分,并按照步骤101选定的抽样策略对偏微分方程组的参数空间进行抽样,对抽样得到的参数场在网格的高斯点处离散化,形成无标签的仅含离散参数场的离散参数场数据集D,具体的:确定抽样离散参数场数目和离散参数场的形状;
[0010]步骤103:从离散参数场数据集D随机抽样出(N1+N2)个离散参数场,求解这(N1+N2)个离散参数场对应的偏微分方程组的节点解,并将其中前N1个离散参数场及其对应的节点
解(标签)作为偏移集L,剩余的N2个离散参数场及其对应的节点解作为测试集T,其中,偏移集L用于对输出的范围进行偏移,详见步骤203;
[0011]步骤104:将上一步骤抽样的(N1+N2)个离散参数场排除出数据集D,形成无标签集U作为训练集;
[0012]步骤105:设定记录迭代次数的变量i,并设置其值为0,将无标签集U分为若干批次的离散参数场样本;
[0013]步骤106:对边界条件进行编码,形成形状和节点解相同的边界条件的掩码张量M,在M当中,位置对应于被约束的节点自由度的M元素被设为0,其余元素被设为1;
[0014]步骤200:使用神经算子模块F预测无标签集U中离散参数场样本的节点解,进一步根据节点解得到离散化的泛函作为系统泛函的估计,包括以下子步骤:
[0015]步骤201:不放回地抽取无标签集U中一批离散纤维角度场样本s,如果所有的批次都被抽出,变量i自增1,判断对神经算子的训练过程是否达到算法收敛条件,如果收敛,则输出神经算子的权重θ,并执行步骤304,否则,打乱无标签集U,并将打乱后的无标签集U重新分为若干个批次,从第一个批次重新抽取、训练;其中,所述的收敛条件可以是i达到训练的最大迭代次数或者神经算子的推理精度已达到精度要求;
[0016]步骤202:将样本s输入神经算子模块F进行推理,利用掩码张量M对F输出的张量F(s)进行掩码操作,得到节点解a,如式(1.1)所示;
[0017]a=F(s)

M(1.1)式(1.1)中,

代表张量之间进行元素积,下同;
[0018]步骤203:使用偏移集L内所有标签的均值mean和标准差std,对节点解a进行偏移处理:
[0019]a=a

std+mean(1.2)
[0020]步骤204:对节点解a进行卷积操作,得到在高斯点处的解及其空间导数;
[0021]步骤205:利用张量操作处理高斯点处的解及其空间导数,求得泛函被积函数在高斯点处的值;
[0022]步骤206:使用高斯积分法,根据泛函被积函数在高斯点处的值,求得离散化的泛函估计Π;
[0023]步骤300:对离散化的泛函施加变分操作构建优化目标,具体的:计算泛函估计Π关于节点解a的梯度R,并将其范数作为最小化目标,采用基于方程组的迭代法获取当前节点解的更新步长Δa,并利用Δa更新神经算子模块F的权重θ,包括以下子步骤:
[0024]步骤301:利用自动微分方法,对泛函估计Π进行反向传播,记录泛函估计Π对节点解a的梯度R,并将其范数作为最小化目标;
[0025]步骤302:将梯度R输入基于方程组的迭代法,得到当前的节点解的更新步长Δa;
[0026]步骤303:使用Δa对神经算子的权重θ进行更新,并返回执行步骤201;
[0027]步骤304:将神经算子模块F在测试集T上进行推理,并统计测试集指标。
[0028]进一步,所述的步骤101中,偏微分方程组的参数空间可以是偏微分方程组的系数或自由项形成的空间,偏微分方程组的参数空间形式可以是B样条曲面和高斯随机场等由参数控制的连续的参数场或由此类参数场作为自变量的函数,抽样策略可以是简单随机抽样法和拉丁超立方抽样法等抽样方法。
[0029]进一步,所述的步骤102中,网格划分的设置可根据具体的研究问题自行调整,对
偏微分方程组的参数空间进行抽样可以指对偏微分方程组参数的直接抽样,也可以指对控制偏微分方程组参数的自变量的抽样,例如,对控制热传导的热传导偏微分方程,可以对热源项进行直接抽样,而对于控制纤维铺层弹性板的弹性力学偏微分方程组,可以对控制本构方程组中的弹性系数的材料主方向坐标轴角度进行抽样,即对纤维角度场进行抽样。
[0030]进一步,所述的步骤103中,求解偏微分方程组所用到的分析方法可以是有限元分析法、边界元分析法、等几何分析法和无网格法等类似分析方法。
[0031]进一步,所述的步骤105中,批次的大小与数目可以根据具体的研究问题自行调整。
[0032]进一步,所述的步骤202中,神经算子模块F包括但不限于单个神经算子和多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于变分原理的面向神经算子训练与偏微分方程组求解的统一方法,其特征在于,包括以下步骤:步骤100:从偏微分方程组的参数空间中抽样形成无标签的仅含离散参数场的数据集D,将数据集D划分为偏移集L、测试集T和无标签集U,将无标签集U分为多个批次,对边界条件进行编码,形成边界条件的掩码张量;步骤200:使用神经算子模块F预测无标签集U中离散参数场样本的节点解,根据节点解得到离散化的泛函作为系统泛函的估计;步骤300:对离散化的泛函施加变分操作构建优化目标,计算泛函估计Π关于节点解a的梯度R,并将其范数作为最小化目标,采用基于方程组的迭代法获取当前节点解的更新步长Δa,并利用Δa更新神经算子模块F的权重θ。2.根据权利要求1所述的一种基于变分原理的面向神经算子训练与偏微分方程组求解的统一方法,其特征在于,所述的步骤100子步骤为:步骤101:选定偏微分方程组的参数空间的形式和抽样策略;步骤102:对偏微分方程组的求解域进行网格划分,并按照步骤101选定的抽样策略对偏微分方程组的参数空间进行抽样,对抽样得到的参数场在网格的高斯点处离散化,形成无标签的仅含离散参数场的离散参数场数据集D;步骤103:从离散参数场数据集D随机抽样出(N1+N2)个离散参数场,求解这(N1+N2)个离散参数场对应的偏微分方程组的节点解,并将其中前N1个离散参数场及其对应的节点解作为偏移集L,剩余的N2个离散参数场及其对应的节点解作为测试集T,其中,偏移集L用于对输出的范围进行偏移;步骤104:将上一步骤抽样的(N1+N2)个离散参数场排除出数据集D,形成无标签集U作为训练集;步骤105:设定记录迭代次数的变量i,并设置其值为0,将无标签集U分为若干批次的离散参数场样本;步骤106:对边界条件进行编码,形成形状和节点解相同的边界条件的掩码张量M,在M当中,位置对应于被约束的节点自由度的M元素被设为0,其余元素被设为1。3.根据权利要求2所述的一种基于变分原理的面向神经算子训练与偏微分方程组求解的统一方法,其特征在于,所述的步骤200子步骤为:步骤201:不放回地抽取无标签集U中一批离散纤维角度场样本s,如果所有的批次都被抽出,变量i自增1,判断对神经算子的训练过程是否...

【专利技术属性】
技术研发人员:徐腾飞郝鹏刘大川
申请(专利权)人:大连理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1