System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于可解释机器学习模型的含能材料熔点预测方法技术_技高网

一种基于可解释机器学习模型的含能材料熔点预测方法技术

技术编号:40285190 阅读:10 留言:0更新日期:2024-02-07 20:38
本发明专利技术公开了一种基于可解释机器学习模型的含能材料熔点预测方法,通过采用了多种高效的特征工程处理技术,包括结构性质、物理化学性质等多个方面,从含能材料的分子结构中提取出关键特征,经过多次模型训练和调整得出的机器学习模型能够快速、精准地对含能材料进行熔点预测。此外,利用可解释性工具完全可以对预测结果进行解释。

【技术实现步骤摘要】

本专利技术涉及含能材料熔点预测,尤其涉及一种基于可解释机器学习模型的含能材料熔点预测方法


技术介绍

1、含能材料是一种被广泛应用的高能量材料,其具有高密度、高能量和高灵敏度等特点,因此被广泛应用于炸药、推进剂、发射火箭和导弹等领域。熔点是一个表示了材料固-液相变的重要热力学性质,与化合物许多性质密切相关。一些炸药对含能材料熔点有非常严格的要求,例如固体推进剂要求材料熔点在150℃以上、熔铸炸药要求含能材料熔点在70-120℃之间。因此对含能材料的熔点进行准确预测,对于设计、合成和指导新型含能材料应用具有重要的指导意义。

2、传统的计算方法,例如分子力学和密度泛函理论等,可以预测高能化合物的物理化学性质,但是需要消耗大量时间和计算资源。近年来,机器学习算法因其具有高效、精准、可解释性强等特点,逐步成为研究含能材料的主流方法之一。机器学习是一种基于数据的方法,它通过学习数据的模式和规律,实现对新数据的分类、预测等任务。机器学习算法可以通过对包括熔点在内的化学性质进行特征工程,使用分类和回归模型对化合物的熔点进行预测(cn201910672743.6)。在研究含能材料方面,通过引入含能材料的结构和性质等特征,使用机器学习算法来训练模型,可以对含能材料包括熔点在内的各种性质进行预测(cn202111484713.6)。但是,机器学习算法在具体应用时需要注意误导性结论,需要采用可解释性机器学习方法来揭示隐藏的机制,从而提高预测的处理能力和准确性。

3、传统的预测模型对材料的熔点进行预测时,通常的均方根误差超过36k(w.mi,h.chen,d.zhu,et al.,on prediction of melting points without computersimulation:a focus on energetic molecular crystals,s.v.bondarchuk,meltingpoint prediction of organic molecules by deciphering the chemical structureinto a natural language),虽然接近实验误差的32k,但并不能很好的进行实际应用。


技术实现思路

1、本专利技术的目的就在于为了解决传统熔点预测方法精度不高,模型结果存在误导性问题而提供一种基于可解释机器学习模型的含能材料熔点预测方法,机器学习分类算法提供了一种改善材料熔点预测的方法,使用分类模型可以针对材料对熔点的具体要求进行模型训练,从而提高预测精度并改善材料研发和实际应用之间的效率。通过使用可解释的机器学习算法进行熔点预测,并结合物理化学直觉与更大、更多样化的数据集,以获得更全面准确的预测模型,从而满足实际要求。

2、本专利技术收集化合物的结构与熔点数据,通过量化计算得到部分化合物性质数据,以机器学习分类模型为基础,使用可解释性工具进行模型解释。从而得到对含能材料熔点较为准确的、令人信服的预测模型。

3、本专利技术通过以下技术方案来实现上述目的:

4、一种基于可解释机器学习模型的含能材料熔点预测方法,包括以下步骤:

5、步骤1,从已发表的论文中收集并筛选出大量符合标准的精确化合物数据;

6、步骤2,使用量子化学方法对所得到的含能化合物数据进行量化计算,得到模型建立所需的特征值集合;

7、步骤3,对特征值集合进行处理,避免因特征值数据问题对模型性能造成不良影响;

8、步骤4,使用处理好的自定义描述符集合训练并优化模型,实现对含能材料熔点的精确预测;

9、步骤5,使用shap工具对建立好的模型进行进一步分析,分析不同特征对含能材料熔化行为的影响。

10、进一步方案为,所述步骤1中,对材料数据筛选标准包括化合物只含有chno元素、不含有离子化物、不含共晶或溶剂化物、在标准大气压和室温下晶体结构稳定、不含有无序或错乱结构、使用dsc实验测定熔点值并且dsc升温速率为5-10k每分钟。

11、进一步方案为,所述步骤2中,对经过筛选的材料数据进行的量化计算包括使用dft的b3lyp/6-31g(d,p)基组计算的偶极矩;

12、使用b3lyp/6-31g(d,p)基组进行电子结构计算得出的静电势相关性质:

13、使用pbe-d3(bj)基组计算出的晶格能;

14、使用公式(1)计算出的升华焓;

15、

16、使用公式(2)计算出的氧平衡,即对于cahbocnd;

17、

18、使用rdkit和mordred工具包计算出的特征描述符。

19、进一步方案为,所述步骤3中,将计算出的特征描述符进行标准化处理,即对每个特征的具体数值减去该特征的平均值,然后除以该特征的标准差,将所有的特征值缩放到同一维度,避免数据因尺度不同对模型性能造成影响。

20、进一步方案为,所述步骤4中,首先将数据集按照0℃-20℃、20℃-40℃、40℃-60℃每20℃为一个类别的方式划分为了12个区间,然后使用划分好的数据训练并优化模型,在优化时采用网格搜索的方法在整个参数空间内搜索最佳的参数组合,并且使用交叉验证的方法降低因为数据分布的原因而造成模型过拟合的概率。

21、进一步方案为,所述步骤5中,使用shap计算出每一个特征值对应的shap值,从而得到每个特征对模型结果的影响程度,并且输出瀑布图等图例对模型结果进行可视化,从而得到对含能材料熔化行为更深层次的见解。

22、本专利技术的有益效果在于:

23、本专利技术的一种基于可解释机器学习模型的含能材料熔点预测方法,通过采用了多种高效的特征工程处理技术,包括结构性质、物理化学性质等多个方面,从含能材料的分子结构中提取出关键特征,经过多次模型训练和调整得出的机器学习模型能够快速、精准地对含能材料进行熔点预测。此外,利用可解释性工具完全可以对预测结果进行解释。本专利技术所提供的机器学习方法具有快速、高效、精准预测,易于理解和解释等优势,对含能材料的熔化行为进行深入研究提供了新的思路和方法。

本文档来自技高网...

【技术保护点】

1.一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,所述步骤1中,对材料数据筛选标准包括化合物只含有CHNO元素、不含有离子化物、不含共晶或溶剂化物、在标准大气压和室温下晶体结构稳定、不含有无序或错乱结构、使用DSC实验测定熔点值并且DSC升温速率为5-10K每分钟。

3.如权利要求1所述的一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,所述步骤2中,对经过筛选的材料数据进行的量化计算包括使用DFT的B3LYP/6-31G(d,p)基组计算的偶极矩;

4.如权利要求1所述的一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,所述步骤3中,将计算出的特征描述符进行标准化处理,即对每个特征的具体数值减去该特征的平均值,然后除以该特征的标准差,将所有的特征值缩放到同一维度,避免数据因尺度不同对模型性能造成影响。

5.如权利要求1所述的一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,所述步骤4中,首先将数据集按照0℃-20℃、20℃-40℃、40℃-60℃每20℃为一个类别的方式划分为了12个区间,然后使用划分好的数据训练并优化模型,在优化时采用网格搜索的方法在整个参数空间内搜索最佳的参数组合,并且使用交叉验证的方法降低因为数据分布的原因而造成模型过拟合的概率。

6.如权利要求1所述的一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,所述步骤5中,使用SHAP计算出每一个特征值对应的SHAP值,从而得到每个特征对模型结果的影响程度,并且输出瀑布图等图例对模型结果进行可视化,从而得到对含能材料熔化行为更深层次的见解。

...

【技术特征摘要】

1.一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,所述步骤1中,对材料数据筛选标准包括化合物只含有chno元素、不含有离子化物、不含共晶或溶剂化物、在标准大气压和室温下晶体结构稳定、不含有无序或错乱结构、使用dsc实验测定熔点值并且dsc升温速率为5-10k每分钟。

3.如权利要求1所述的一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,所述步骤2中,对经过筛选的材料数据进行的量化计算包括使用dft的b3lyp/6-31g(d,p)基组计算的偶极矩;

4.如权利要求1所述的一种基于可解释机器学习模型的含能材料熔点预测方法,其特征在于,所述步骤3中,将计算出的特征描述符进行标准化处理,即对每个特征的具体数值...

【专利技术属性】
技术研发人员:黄鑫张朝阳陈鹏
申请(专利权)人:中国工程物理研究院化工材料研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1