使用神经网络预测原子系统的交换相关能量技术方案

技术编号:38874112 阅读:11 留言:0更新日期:2023-09-22 14:08
用于预测原子系统的交换相关能量的方法、计算机系统和装置,包括在计算机存储介质上编码的计算机程序。该系统:获得多个网格点的每个处的原子系统的相应的电子轨道特征;为多个网格点中的每一个生成该网格点处的电子轨道特征的相应的输入特征向量;以及使用神经网络处理多个网格点的相应的输入特征向量以生成原子系统的预测的交换相关能量。原子系统的预测的交换相关能量。原子系统的预测的交换相关能量。

【技术实现步骤摘要】
【国外来华专利技术】使用神经网络预测原子系统的交换相关能量
[0001]相关申请的交叉引用
[0002]本申请要求2021年1月8日的美国临时专利申请No.63/135,223的优先权,其公开内容通过引用整体并入本文。


[0003]本说明书总体上涉及使用神经网络预测原子系统(诸如中性或带电分子或者中性或带电单个原子)的属性。

技术介绍

[0004]神经网络是采用一个或多个非线性单元层来针对接收到的输入预测输出的机器学习模型。一些神经网络除了输出层之外还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中下一层(即下一个隐藏层或输出层)的输入。网络的每一层根据相应的参数集的当前值从接收到的输入生成输出。

技术实现思路

[0005]本说明书描述了用于预测原子系统的交换相关能量的方法、计算机系统和装置,包括在计算机存储介质上编码的计算机程序。具体地,这些技术包括使用神经网络来处理原子系统的电子轨道特征以输出原子系统的预测的交换相关能量。
[0006]在一个创新方面,本说明书描述了一种预测原子系统的交换相关能量的预测方法。该方法由包括一个或多个计算机的系统实现。该系统:获得在多个网格点中的每一个处的原子系统的相应的电子轨道特征;为多个网格点中的每一个生成在网格点处的电子轨道特征的相应的输入特征向量;以及使用神经网络处理多个网格点的相应的输入特征向量以生成原子系统的预测的交换相关能量。
[0007]在预测方法的一些实施方式中,在包括多个训练示例的训练数据上训练神经网络,训练示例各自对应于相应的原子系统。训练示例包括对应于具有满足一个或多个数学约束条件的电子轨道特征和能级的原子系统的训练示例的第一子集。
[0008]每个训练示例可以与训练中采用的相应的数据集相关联,并且包含描述对应原子系统的一个或多个物理属性的数据,诸如原子系统的电子轨道特征、能量标签和/或分子几何形状(即原子系统的原子核的3D相对位置)。对于一些训练示例,数据集的至少一些数据可能已经在现实世界中测量(即通过在现实世界原子系统上执行的测量(实验))。该方法可以包括接收该测量数据的至少一些的初步步骤和/或测量该数据的至少一些的初步步骤(即,通过执行现实世界的实验)。替代地,可以通过计算获得一些或全部数据。
[0009]在该预测方法的一些实施方式中,一个或多个数学约束条件包括:均匀电子气(UEG)约束条件、分数电荷(FC)约束条件或分数自旋(FS)约束条件。
[0010]在该预测方法的一些实施方式中,对应于多个训练示例的原子系统包括具有满足一个或多个数学约束条件的电子轨道特征和能级的合成生成的虚拟原子系统。
[0011]在该预测方法的一些实施方式中,多个网格点包括真实空间正交网格上的网格点。
[0012]在该预测方法的一些实施方式中,针对原子系统获得的电子轨道特征包括以下一项或多项:电子密度分布、电子密度梯度范数分布、动能密度分布、局部Hartree

Fock(HF)交换分布或原子系统的范围分隔形式的局部HF交换分布。
[0013]在预测方法的一些实施方式中,系统通过以下方式为多个网格点中的每一个生成输入特征向量:将在网格点处的电子轨道特征从线性标度转换为对数标度;以及以对数标度级联电子轨道特征以形成网格点的输入特征向量。
[0014]在预测方法的一些实施方式中,神经网络包括:多层感知器(MLP),其被配置为处理在多个网格点处的输入特征向量的每一个,以生成表征与输入特征向量相对应的多个贡献项的多个增强因子;以及数值求积层,其被配置为对多个网格点上由增强因子缩放的多个贡献项的加权和进行积分,以生成原子系统的预测的交换相关能量。
[0015]在预测方法的一些实施方式中,多个贡献项包括以下各项中的一个或多个:局部密度近似(LDA)交换项、HF项或范围分离的HF项。
[0016]在另一创新方面,本说明书描述了一种用于训练神经网络以预测原子系统的交换相关能量的训练方法。该方法由包括一个或多个计算机的系统实现。该系统获得多个训练示例,其中每个训练示例包括原子系统的电子轨道特征和对应的真实能量标签。多个训练示例包括对应于具有满足一个或多个数学约束条件的电子轨道特征以及能级的原子系统的训练示例的第一子集。对于每个训练示例,利用神经网络根据参数的当前值处理在训练示例中的电子轨道特征以生成训练示例的预测的交换相关能量。该系统还确定相对于训练损失的参数的梯度。该训练损失包括回归损失,该回归损失对于每个训练示例测量在训练示例的预测的交换相关能量与在训练示例中的真实能量标签之间的误差。该系统使用梯度更新参数的当前值。
[0017]在训练方法的一些实施方式中,一个或多个数学约束条件包括分数电荷(FC)约束条件和分数自旋(FS)约束条件。
[0018]在训练方法的一些实施方式中,训练损失还包括自洽场(SCF)损失,SCF损失表示服从电子数守恒的原子系统的计算能量。
[0019]在训练方法的一些实施方式中,系统通过数字合成具有满足一个或多个数学约束条件的电子轨道特征和能级的虚拟原子系统来生成训练示例的第一子集。
[0020]本说明书还提供了一种系统,包括一个或多个计算机和一个或多个存储指令的存储设备,该指令当由一个或多个计算机执行时,使得该一个或多个计算机执行上述的预测方法和/或训练方法。
[0021]本说明书还提供了存储指令的一种或多种计算机存储介质,该指令当由一个或多个计算机执行时,使得该一个或多个计算机执行上述的预测方法和/或训练方法。
[0022]本说明书中描述的主题能够在特定实施例中实现,以便实现以下优点中的一个或多个。
[0023]密度泛函理论(DFT)将量子化学彻底改变为唯一能够保证高精度并扩展到大型化学系统的计算方法。其成功的关键是通过精确的交换相关函数E
xc
的近似来有效描述电子之间的量子力学相互作用。为了试图满足不同科学领域中所要求的准确性和广泛适用性,大
范围的此类近似已经演进。然而,现代通用泛函(functional)仍然存在根本性缺陷,这影响了化学的广泛领域,并且甚至在像这样简单的分子上也很明显。故障通常能够追溯到违反精确泛函的数学属性,例如,违反表现出分数电子行为的系统的精确条件。
[0024]所描述的技术使用深度学习来产生泛函(例如,交换相关泛函,E
xc
),该泛函在大型通用化学数据库上实现了最先进的性能,并且还允许以数据驱动的方式合并精确的约束。值得注意的是,所描述的技术产生了精确的泛函,其解决了同时遵守具有分数电子电荷和自旋(spin)的系统的已知约束的问题。由所描述的技术产生的泛函能够被用于准确预测DFT框架中原子系统的能量。原子系统的预测能量能够被用于预测重要的化学属性,诸如对应原子系统的电离能(ionization energies)、振动属性、生成焓(enthalpies of formation)和反应势垒(reaction barriers)。
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种由一个或多个计算机执行的用于预测原子系统的交换相关能量的方法,所述方法包括:获得在多个网格点中的每一个处的所述原子系统的相应的电子轨道特征;为所述多个网格点中的每一个生成在所述网格点处的所述电子轨道特征的相应的输入特征向量;以及使用神经网络处理所述多个网格点的相应的输入特征向量以生成所述原子系统的预测的交换相关能量。2.根据权利要求1所述的方法,其中:所述神经网络在包括多个训练示例的训练数据上被训练,所述训练示例各自对应于相应的原子系统,并且所述训练示例包括与具有满足一个或多个数学约束条件的电子轨道特征和能级的原子系统对应的训练示例的第一子集。3.根据权利要求2所述的方法,其中:所述一个或多个数学约束条件包括:均匀电子气(UEG)约束条件、分数电荷(FC)约束条件或分数自旋(FS)约束条件。4.根据权利要求2或3中任一项所述的方法,其中:对应于所述多个训练示例的所述原子系统包括具有满足所述一个或多个数学约束条件的电子轨道特征和能级的合成生成的虚拟原子系统。5.根据权利要求2至4中任一项所述的方法,其中,所述训练示例与描述所述对应原子系统的物理属性的数据相关联,多个所述训练示例的所述数据是已经通过在现实世界中对所述对应的原子系统执行的测量而获得的。6.根据权利要求1

5中任一项所述的方法,其中:所述多个网格点包括真实空间正交网格上的网格点。7.根据权利要求1

6中任一项所述的方法,其中:针对所述原子系统获得的所述电子轨道特征包括以下各项中的一个或多个:电子密度分布、电子密度梯度范数分布、动能密度分布、局部HF(Hartree

Fock)交换分布或所述原子系统的范围分离形式的所述局部HF交换分布。8.根据权利要求1

7中任一项所述的方法,其中,为所述多个网格点中的每一个生成所述输入特征向量包括:将在所述网格点处的所述电子轨道特征从线性标度转换为对数标度;以及以所述对数标度级联所述电子轨道特征以形成所述网格点的所述输入特征向量。9.根据权利要求1

8中任一项所述的方法,其中,所述神经网络包括:多层感知器(MLP),所述多层感知器被配置为处理在所述多个网格点处的所述输入特征向量的每一个,以生成表征与所述输入特征向量相对应的多个贡献项的多个增强因子;以及数值求积层,所述数值求积层被配置为对所述多个网格点上由所述增强因子缩放的所述多个贡献项的加权和进行积分,以生成所述原子系统的所述预测的交换相关能量。10.根据权利要求9中任一项所述的方法,其中:所述多个贡献项包括以下各项中的一个或多个:局部密度近似(LDA)...

【专利技术属性】
技术研发人员:詹姆斯
申请(专利权)人:渊慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1