System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 机器学习加速的酸根阴离子水化结构第一性原理预测方法技术_技高网
当前位置: 首页 > 专利查询>中南大学专利>正文

机器学习加速的酸根阴离子水化结构第一性原理预测方法技术

技术编号:40339996 阅读:7 留言:0更新日期:2024-02-09 14:28
本发明专利技术公开了一种机器学习加速的酸根阴离子水化结构第一性原理预测方法,该方法包括如下步骤:S1、构建离子水化结构M_mH<subgt;2</subgt;O,并进行优化;S2、对优化后的离子水化结构进行扰动,生成训练数据集;S3、对所述训练数据集进行机器学习力场训练,建立机器学习模型;S4、对所述机器学习模型进行分子动力学模拟,并标识出力偏差在预设范围内的原子结构作为候选构型;S5、将通过验证的所述候选构型合并到后续迭代训练集中,以进一步完善和训练机器学习模型直至模型收敛,得到精准的深度势能模型;S6、对深度势能模型进行深度学习加速的分子动力学模拟,最终得到酸根阴离子的水化结构。本发明专利技术在保证计算精度的前提下,极大的提升了计算效率,降低了计算成本。

【技术实现步骤摘要】

本专利技术涉及酸根阴离子水化结构的预测,具体地,涉及一种机器学习加速的酸根阴离子水化结构第一性原理预测方法


技术介绍

1、离子周围的水化结构对化学反应的电子传递、反应速率等过程存在重要影响。这种水化作用可以改变化学反应的驱动力,使其成为在选择性作用时需要考虑的一项关键因素。目前,有关金属阳离子,如pb(ii)、cu(ii)、fe(ii)、fe(iii)、zn(ii)、v(ii)、v(iii)、ca(ii)、mg(ii)等在水溶液中的水化结构先后有相关报道研究,但针对金属阳离子和氧或硫等组成的酸根阴离子,如wo42−、mos42−等的水化结构未见研究。

2、为了更加准确模拟地离子水化的真实环境,需要在其周围考虑大量的水分子,这导致传统实验无法精细定量测量。通过使用高速计算机和精确的量子力学算法,量子化学理论计算可以模拟和预测复杂的化学反应。目前,从头算分子动力学(ab initiomolecular dynamics, aimd)模拟已经基本解决了“算不准”的问题,但“算不快”和“价格昂贵”的问题依然存在。以wo42−_100h2o_2na的体系进行模拟为例,在2个节点共计96核的高性能计算服务器上以时间步长0.5 fs模拟4000步共计2 ps,需要不中断运行约12天的时间,产生约1400元的计算服务费用(0.05元/核时)。显然,若进行100 ps从头算分子动力学模拟,需要不间断运行约60天,花费约70000元,这种缓慢的计算进度和昂贵的计算费用并不具有性价比。

3、因此,针对离子水化结构,特别是酸根阴离子如wo42−、mos42−等水化结构的精确、快速预测需要建立系统的研究方法。


技术实现思路

1、针对上述酸根阴离子水化结构预测时“算不快”和“价格昂贵”的问题,本专利技术提供了一种机器学习加速的酸根阴离子水化结构第一性原理预测方法,该方法在保证计算精度的前提下,极大的提升了计算效率,降低了计算成本。

2、为了实现上述目的,本专利技术提供一种机器学习加速的酸根阴离子水化结构第一性原理预测方法,该预测方法包括如下步骤:

3、s1、构建离子水化结构m_mh2o,并进行优化;

4、s2、对优化后的离子水化结构进行扰动,生成训练数据集;

5、s3、对所述训练数据集进行机器学习力场训练,建立机器学习模型;

6、s4、对所述机器学习模型进行分子动力学模拟,并标识出力偏差在预设范围内的原子结构作为候选构型;

7、s5、将通过验证的所述候选构型合并到后续迭代的训练集中,以进一步完善和训练机器学习模型,直至模型收敛,得到精准的深度势能(deep potential, dp)模型;

8、s6、对得到的深度势能模型进行深度学习加速的分子动力学模拟,最终得到酸根阴离子的水化结构。

9、上述技术方案实现了对离子水化结构进行深度势能加速的分子动力学计算模拟,特别是针对酸根阴离子水化结构的首次快速精准预测,传统的从头算分子动力学模拟一般只能模拟1~10 ps,而深度势能加速的分子动力学模拟可以轻松模拟到100 ps~1000 ps,保证计算精度的前提下,极大的提升了计算效率,降低了计算成本。

10、具体地,步骤s1中,利用materials studio软件构建所述离子水化结构的方法为:首先创建一个周期性的模拟盒,在盒子的中心放置酸根离子m,随后将m个h2o均匀且无序地分布在酸根离子m周围,在盒子的边缘放置碱金属离子以平衡电荷,从而完成离子初始水化结构m_mh2o的构建,其中,m的取值为40以上。

11、上述技术方案中,在选择h2o的初始排列和m与h2o之间的初始距离时,需进行仔细考虑以确保模拟的初始状态是合理的。

12、在上述技术方案的基础上,进一步地,为了更加准确描述和构建离子m的水化结构,通过第一性原理密度泛函理论(density functional theory, dft)计算,在进行离子水化结构的构建前,还进行了预先优化,所述预先优化的方法为:使用ωb97xd、b3lyp或pbe泛函配备def2-tzvp、def2-svp、def2-qzvp、def2-tzvpp、cc-pvdz-pp或aug-cc-pvdz-pp基组,对与离子m周围最紧密层的n个h2o组成的简单水化结构m_nh2o进行结构预先优化,得到酸根离子m的紧密层水化结构。此时,针对于步骤s1,其余(m-n)个h2o均匀无序的分布在m_nh2o的周围,从而完成离子初始水化结构m_mh2o的构建。随后,采用vienna ab initiosimulation package(vasp)软件包,对所构建的离子水化结构进行结构优化。

13、具体地,步骤s2中,所述扰动包括改变原子坐标位置和模拟盒子的尺寸,生成a个不同的扰动结构,每个扰动结构在298.15 k的nvt系综中,以0.5~1.5 fs的时间步长对每个构型记录b帧,进行短时(步长×帧数)的从头算分子动力学(aimd)模拟,生成a×b帧的训练数据集,作为deepmd模型的基础训练数据;其中a的取值范围为15~30、b的取值范围为15~25。

14、优选地,时间步长取值为0.5 fs,a的取值为20、b的取值为20。

15、所述扰动是在已经得到优化的结构基础上进行适当改变原子坐标位置和模拟盒子的尺寸,以进一步得到更多符合要求的结构,从而生成训练数据集。

16、具体地,步骤s3中,通过deep potential generator(dp-gen)与deepmd-kit软件包,针对上述训练数据集进行机器学习力场的训练;所述机器学习力场训练包括2×105~8×105步,每次训练建立2~5个独立的机器学习模型,这些模型虽使用相同的参考数据集,但具有不同的初始权重值。优选的,训练步数取值为4×105步,独立的机器学习模型数取值为4。

17、具体地,步骤s4中,所述分子动力学模拟的方法为:在至少5种不同的温度条件下,利用大规模原子/分子并行模拟器lammps,以nvt系综对离子水化结构进行分子动力学模拟,模拟过程中,标识出力偏差范围在0.11~0.30 ev/å内的原子结构作为候选构型,并最多选取300个候选构型。

18、lammps接口齐全,极易扩展,可以对经过机器学习力场训练得到力场的模型进行快速的分子动力学并行模拟计算,以在力偏差范围内选取候选构型。

19、作为本专利技术的一个优选实施方式,在250 k、280 k、300 k、320 k和350 k五种不同的温度条件下,利用lammps,以nvt系综对离子水化结构进行分子动力学模拟。

20、选择这五种温度是在250 k~350 k温度范围内构建的一个温度梯度,充分考虑了常用温度情况,确保得到的水化结构更加合理。

21、具体地,步骤s5中,所述候选构型在经过dft(density functional theory,密度泛函理本文档来自技高网...

【技术保护点】

1.一种机器学习加速的酸根阴离子水化结构第一性原理预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的预测方法,其特征在于,步骤S1中,所述离子水化结构的构建方法为:首先创建一个周期性的模拟盒,在盒子的中心放置酸根离子M,随后将m个H2O均匀且无序地分布在酸根离子M周围,最后在盒子的边缘放置碱金属离子以平衡电荷,从而完成离子初始水化结构M_mH2O的构建,其中,m的取值为40以上。

3.根据权利要求2所述的预测方法,其特征在于,在进行离子水化结构的构建前,还进行了预先优化,所述预先优化的方法为:使用ωB97XD、B3LYP或PBE泛函配备def2-TZVP、def2-SVP、def2-QZVP、def2-TZVPP、cc-pVDZ-PP或aug-cc-pVDZ-PP基组,对与离子M周围最紧密层的n个H2O组成的简单水化结构M_nH2O进行结构预先优化,得到酸根离子M的紧密层水化结构,其中n的取值不超过10。

4.根据权利要求1所述的预测方法,其特征在于,步骤S2中,所述扰动包括改变原子坐标位置和模拟盒子的尺寸,生成A个不同的扰动结构,每个扰动结构在298.15 K的NVT系综中,以0.5~1.5 fs的时间步长对每个构型记录B帧,进行短时的从头算分子动力学模拟,生成A×B帧的训练数据集,作为DeepMD模型的基础训练数据;其中A的取值范围为15~30、B的取值范围为15~25。

5.根据权利要求4所述的预测方法,其特征在于,所述时间步长取值为0.5 fs,A的取值为20,B的取值为20。

6.根据权利要求1所述的预测方法,其特征在于,步骤S3中,所述机器学习力场训练包括2×105~8×105步,每次训练建立2~5个独立的机器学习模型,每个独立的机器学习模型具有不同的初始权重值。

7.根据权利要求1所述的预测方法,其特征在于,步骤S4中,所述分子动力学模拟的方法为:在至少5种不同的温度条件下,利用大规模原子/分子并行模拟器LAMMPS,以NVT系综对离子水化结构进行分子动力学模拟,模拟过程中,标识出力偏差范围在0.11~0.30 eV/Å内的原子结构作为候选构型,并最多选取300个候选构型。

8.根据权利要求7所述的预测方法,其特征在于,在250 K、280 K、300 K、320 K和350 K五种不同的温度条件下,利用LAMMPS,以NVT系综对离子水化结构进行分子动力学模拟。

9.根据权利要求1所述的预测方法,其特征在于,步骤S5中,所述候选构型在经过DFT计算验证通过其能量和原子力后,被合并到后续迭代的训练集中。

10.根据权利要求1至9中任一项所述的预测方法,其特征在于,步骤S6中,将训练好的机器学习力场应用于LAMMPS软件,对得到的DP模型进行50~1000 ps的深度学习加速的分子动力学DPMD模拟,并最终得到酸根阴离子的水化结构。

...

【技术特征摘要】

1.一种机器学习加速的酸根阴离子水化结构第一性原理预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的预测方法,其特征在于,步骤s1中,所述离子水化结构的构建方法为:首先创建一个周期性的模拟盒,在盒子的中心放置酸根离子m,随后将m个h2o均匀且无序地分布在酸根离子m周围,最后在盒子的边缘放置碱金属离子以平衡电荷,从而完成离子初始水化结构m_mh2o的构建,其中,m的取值为40以上。

3.根据权利要求2所述的预测方法,其特征在于,在进行离子水化结构的构建前,还进行了预先优化,所述预先优化的方法为:使用ωb97xd、b3lyp或pbe泛函配备def2-tzvp、def2-svp、def2-qzvp、def2-tzvpp、cc-pvdz-pp或aug-cc-pvdz-pp基组,对与离子m周围最紧密层的n个h2o组成的简单水化结构m_nh2o进行结构预先优化,得到酸根离子m的紧密层水化结构,其中n的取值不超过10。

4.根据权利要求1所述的预测方法,其特征在于,步骤s2中,所述扰动包括改变原子坐标位置和模拟盒子的尺寸,生成a个不同的扰动结构,每个扰动结构在298.15 k的nvt系综中,以0.5~1.5 fs的时间步长对每个构型记录b帧,进行短时的从头算分子动力学模拟,生成a×b帧的训练数据集,作为deepmd模型的基础训练数据;其中a的取值范围为15~30、b的取值范围为15~25。

【专利技术属性】
技术研发人员:张晨阳韩明君樊东孙伟李洁刘思源王嵘裴勇陈建华
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1