System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于扩散模型的晶体结构生成方法及装置制造方法及图纸_技高网

基于扩散模型的晶体结构生成方法及装置制造方法及图纸

技术编号:40158292 阅读:6 留言:0更新日期:2024-01-26 23:33
基于扩散模型的晶体结构生成方法及装置,利用原子间的相对距离不仅可以全面表征晶体的E(3)等变性,对数据集不做任何更改;引入线性插值提高晶体生成的多样性和新颖性,使用线性组合的方式将两种晶体结构按照比重分别添加高斯噪声融合后得到混合高斯噪音然后逐步去除噪音,可以将两种晶体结构平滑可控的融合,理论上可以生成数以万计种新型晶体结构,极大节省人工合成材料成本且省去合成方式构思;通过键预测器作为引导提高原子坐标生成精度,基于键对原子坐标的强依赖,轻微的原子扰动便会影响键的类型和是否成键,因此使用交叉熵损失函数且其梯度作为优化方向从而对原子坐标生成起到修正作用;综合提升扩散模型在无机晶体结构生成的表现。

【技术实现步骤摘要】

本专利技术涉及一种基于扩散模型的晶体结构生成方法及装置,属于无机晶体结构生成。


技术介绍

1、目前,扩散模型已经应用于多种图像生成场景,并已逐步拓展到自然科学领域,比如药物发现,材料设计以及医学图像重构等。在分子生成尤其是有机分子生成方面,基于扩散模型的深度生成方法也在不断引起研究人员的关注。

2、无机晶体材料功能非常丰富,可用于制备各种器件比如激光器、led、太阳能电池、传感器等,也可作为气固反应催化剂。扩散模型用于无机晶体结构生成处于初始研究阶段,在处理晶体结构对称性以及生成键的方式上具有朴素性质。传统技术采用数据增广的方式表征晶体结构的e(3)不变性,不仅鲁棒性和泛化能力差,而且数倍扩增训练数据集,从而增加计算资源消耗,无论从训练精度还是收敛速度上均不乐观。


技术实现思路

1、为此,本专利技术提供一种基于扩散模型的晶体结构生成方法及装置,解决传统技术鲁棒性和泛化能力差,计算资源消耗大,生成效果不佳的问题。

2、为了实现上述目的,本专利技术提供如下技术方案:基于扩散模型的晶体结构生成方法,包括:

3、获取开源晶体结构数据集作为晶体结构生成数据集,所述晶体结构生成数据集由表示每种晶体结构的晶胞参数及原子三维坐标的cif类型文件构成;

4、使用化学信息文件类型转化包将所述cif类型文件批次转化为训练所需的sdf类型文件,所述sdf类型文件包括晶胞原子个数、原子成键邻接矩阵及每个原子的三维坐标;将格式转换后的所述晶体结构生成数据集划分为训练集、验证集和测试集;

5、构建晶体结构生成扩散模型,所述晶体结构生成扩散模型具有前向加噪过程和逆向去噪过程,前向加噪过程使用预定义的超参数表示条件概率分布均值和方差,逆向去噪过程通过预测前向加噪过程所添加的噪音对数据进行还原;

6、通过图神经网络构建键预测器,键预测器的输入值为所述晶体结构生成数据集中原子坐标和原子类型,键预测器的输出值为键类型;

7、使用训练集对晶体结构生成扩散模型进行训练,使用验证集评估训练晶体结构生成扩散模型在未知数据集的预测能力,使用测试集对训练后的晶体结构生成扩散模型进行测试得到最终的晶体结构生成扩散模型;

8、利用给定的高斯噪音,通过构建的键预测器和最终的所述晶体结构生成扩散模型生成晶体结构;

9、对训练完毕的所述晶体结构生成扩散模型所生成的新型晶体结构进行线性插值,将两个不同晶体结构加噪至不同时间戳,设置插值因子,以控制每种晶体结构在复合晶体中的占有比重。

10、作为基于扩散模型的晶体结构生成方法优选方案,通过所述晶体结构生成扩散模型对格式转换后的所述晶体结构生成数据集进行扩散处理,扩散处理后的所述晶体结构生成数据集近似符合标准高斯分布;

11、逆向去噪过程中,构建神经网络进行学习预测所添加的噪音,使用图神经网络对原子之间的相对距离进行传递表征晶体的e(3)等变性,将所添加噪音与预测噪音之间的l2范数作为损失函数。

12、作为基于扩散模型的晶体结构生成方法优选方案,键预测器的输出值键类型判断为二分类任务,使用交叉熵作为损失函数,通过梯度值引导所述晶体结构生成扩散模型的学习条件概率分布,对生成的晶体原子坐标进行修正。

13、作为基于扩散模型的晶体结构生成方法优选方案,利用给定的高斯噪音,通过最终的晶体结构生成扩散模型生成晶体结构过程中:

14、随机从多维标准高斯噪音分布中采集噪音值作为起始值实现逆向去噪过程,逆向去噪的高斯噪音维度包括晶胞所含原子坐标、所有原子种类的one-hot编码;

15、所述晶体结构生成扩散模型根据学习到的条件分布连续对输入值去噪,最终得到符合原始数据集分布的真值。

16、作为基于扩散模型的晶体结构生成方法优选方案,通过线性插值增加所述晶体结构生成扩散模型生成晶体结构种类,将两种不同晶体结构分别加噪至时间戳t1,t2,且t1+t2 = t,t为总扩散时间步。

17、作为基于扩散模型的晶体结构生成方法优选方案,使用生成的晶体结构补充为训练集,再次对所述晶体结构生成扩散模进行训练,使生成的晶体结构符合原始数据集分布。

18、本专利技术还提供一种基于扩散模型的晶体结构生成装置,包括:

19、数据集获取模块,用于获取开源晶体结构数据集作为晶体结构生成数据集,所述晶体结构生成数据集由表示每种晶体结构的晶胞参数及原子三维坐标的cif类型文件构成;

20、格式转换模块,用于使用化学信息文件类型转化包将所述cif类型文件批次转化为训练所需的sdf类型文件,所述sdf类型文件包括晶胞原子个数、原子成键邻接矩阵及每个原子的三维坐标;

21、数据集划分模块,用于将格式转换后的所述晶体结构生成数据集划分为训练集、验证集和测试集;

22、扩散模型处理模块,用于构建晶体结构生成扩散模型,所述晶体结构生成扩散模型具有前向加噪过程和逆向去噪过程,前向加噪过程使用预定义的超参数表示条件概率分布均值和方差,逆向去噪过程通过预测前向加噪过程所添加的噪音对数据进行还原;

23、键预测器构建模块,用于通过图神经网络构建键预测器,键预测器的输入值为所述晶体结构生成数据集中原子坐标和原子类型,键预测器的输出值为键类型;

24、模型训练模块,用于使用训练集对晶体结构生成扩散模型进行训练,使用验证集评估训练晶体结构生成扩散模型在未知数据集的预测能力,使用测试集对训练后的晶体结构生成扩散模型进行测试得到最终的晶体结构生成扩散模型;

25、晶体结构生成模块,用于利用给定的高斯噪音,通过构建的建键预测器和最终的所述晶体结构生成扩散模型生成晶体结构。

26、线性插值处理模块,用于对训练完毕的所述晶体结构生成扩散模型所生成的新型晶体结构进行线性插值,将两个不同晶体结构加噪至不同时间戳,设置插值因子,以控制每种晶体结构在复合晶体中的占有比重。

27、作为基于扩散模型的晶体结构生成装置优选方案,所述扩散模型处理模块中,通过所述晶体结构生成扩散模型对格式转换后的所述晶体结构生成数据集进行扩散处理,扩散处理后的所述晶体结构生成数据集近似符合标准高斯分布;

28、所述扩散模型处理模块的逆向去噪过程中,构建神经网络进行学习预测所添加的噪音,使用图神经网络对原子之间的相对距离进行传递表征晶体的e(3)等变性,将所添加噪音与预测噪音之间的l2范数作为损失函数。

29、作为基于扩散模型的晶体结构生成装置优选方案,所述键预测器构建模块中,键预测器的输出值键类型判断为二分类任务,使用交叉熵作为损失函数,通过梯度值引导所述晶体结构生成扩散模型的学习条件概率分布,对生成的晶体原子坐标进行修正。

30、作为基于扩散模型的晶体结构生成装置优选方案,所述晶体结构生成模块中,随机从多维标准高斯噪音分布中采集噪音值作为起始值实现逆向去噪过程,逆向去噪的高斯噪音维度包括晶胞所含原子坐标本文档来自技高网...

【技术保护点】

1.基于扩散模型的晶体结构生成方法,其特征在于,包括:

2.根据权利要求1所述的基于扩散模型的晶体结构生成方法,其特征在于,通过所述晶体结构生成扩散模型对格式转换后的所述晶体结构生成数据集进行扩散处理,扩散处理后的所述晶体结构生成数据集符合标准高斯分布;

3.根据权利要求1所述的基于扩散模型的晶体结构生成方法,其特征在于,键预测器的输出值键类型判断为二分类任务,使用交叉熵作为损失函数,通过梯度值引导所述晶体结构生成扩散模型的学习条件概率分布,对生成的晶体原子坐标进行修正。

4.根据权利要求1所述的基于扩散模型的晶体结构生成方法,其特征在于,利用给定的高斯噪音,通过最终的晶体结构生成扩散模型生成晶体结构过程中:

5.根据权利要求1所述的基于扩散模型的晶体结构生成方法,其特征在于,通过线性插值增加所述晶体结构生成扩散模型生成晶体结构种类,将两种不同晶体结构分别加噪至时间戳t1,t2,且t1+t2 = T,T为总扩散时间步。

6.根据权利要求5所述的基于扩散模型的晶体结构生成方法,其特征在于,使用生成的晶体结构补充为训练集,再次对所述晶体结构生成扩散模进行训练,使生成的晶体结构符合原始数据集分布。

7.基于扩散模型的晶体结构生成装置,其特征在于,包括:

8.根据权利要求7所述的基于扩散模型的晶体结构生成装置,其特征在于,所述扩散模型处理模块中,通过所述晶体结构生成扩散模型对格式转换后的所述晶体结构生成数据集进行扩散处理,扩散处理后的所述晶体结构生成数据集符合标准高斯分布;

9.根据权利要求7所述的基于扩散模型的晶体结构生成装置,其特征在于,所述键预测器构建模块中,键预测器的输出值键类型判断为二分类任务,使用交叉熵作为损失函数,通过梯度值引导所述晶体结构生成扩散模型的学习条件概率分布,对生成的晶体原子坐标进行修正。

10.根据权利要求7所述的基于扩散模型的晶体结构生成装置,其特征在于,所述晶体结构生成模块中,随机从多维标准高斯噪音分布中采集噪音值作为起始值实现逆向去噪过程,逆向去噪的高斯噪音维度包括晶胞所含原子坐标、所有原子种类的one-hot编码;

...

【技术特征摘要】

1.基于扩散模型的晶体结构生成方法,其特征在于,包括:

2.根据权利要求1所述的基于扩散模型的晶体结构生成方法,其特征在于,通过所述晶体结构生成扩散模型对格式转换后的所述晶体结构生成数据集进行扩散处理,扩散处理后的所述晶体结构生成数据集符合标准高斯分布;

3.根据权利要求1所述的基于扩散模型的晶体结构生成方法,其特征在于,键预测器的输出值键类型判断为二分类任务,使用交叉熵作为损失函数,通过梯度值引导所述晶体结构生成扩散模型的学习条件概率分布,对生成的晶体原子坐标进行修正。

4.根据权利要求1所述的基于扩散模型的晶体结构生成方法,其特征在于,利用给定的高斯噪音,通过最终的晶体结构生成扩散模型生成晶体结构过程中:

5.根据权利要求1所述的基于扩散模型的晶体结构生成方法,其特征在于,通过线性插值增加所述晶体结构生成扩散模型生成晶体结构种类,将两种不同晶体结构分别加噪至时间戳t1,t2,且t1+t2 = t,t为总扩散时间步。

6.根据权利要求5所述的基于扩散模型的晶体结构生...

【专利技术属性】
技术研发人员:鲍雨张翔宇姜会秀李中伟
申请(专利权)人:烟台国工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1