System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于可解释的高维空间预测模型的氧化物玻璃性能预测方法技术_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于可解释的高维空间预测模型的氧化物玻璃性能预测方法技术

技术编号:40317309 阅读:10 留言:0更新日期:2024-02-07 20:59
本发明专利技术公开了一种基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,涉及玻璃材料领域,包括以下步骤:(1)从玻璃材料数据库中提取玻璃组分元素含量以及对应性能数据组成初始样本集;(2)对初始样本集进行数据清洗;(3)基于随机森林算法建立高维空间预测模型并对其进行参数优化;(4)对参数优化后的高维空间预测模型进行可解释性研究;(5)使用可解释性研究结果进行目标性能玻璃组分设计,使用参数优化后的高维空间预测模型预测待测氧化物玻璃的性能。本发明专利技术方法得到的高维空间预测模型具有更好的泛化性能以及更广阔组分的适用性,得到的结果对于指导玻璃反向设计具有十分重要的现实意义。

【技术实现步骤摘要】

本专利技术涉及玻璃材料领域,具体涉及一种基于可解释的高维空间预测模型的氧化物玻璃性能预测方法


技术介绍

1、玻璃是现代生活中不可或缺的一种材料,组分与性能关系的定量化预测一直是玻璃领域的难点和热点。理论上,只要冷却速率足够快,元素周期表中几乎所有元素都可以形成玻璃,可能的组分多达1052种,同时,玻璃的非晶态特性使其在化学组成上不需要遵循化学计量的要求,导致玻璃新材料的开发可以搜索的组分空间十分巨大。此外,玻璃的非平衡和非遍历特性又使得玻璃结构难以用平衡热力学或者统计力学的方法来描述,这对传统的试错型和经验型开发方式提出了严峻挑战,亟待引入更快速、更高效的方法。

2、随着近年“材料基因组计划”的实施,以机器学习(machine learning)为代表的数据驱动型建模技术快速发展,并逐渐渗透进玻璃领域。材料基因工程通过采用高通量并行迭代方法替代传统试错法中的多次顺序迭代方法,逐步由“经验指导实验”向“理论预测和实验验证相结合”的材料研究新模式转变,以提高新材料的研发效率。

3、机器学习技术依赖于算法和数据,然而一些表现较好的复杂算法模型往往具有较差的可解释性,这使得预测的结果难以被理解,无法对玻璃设计提供实际的指导,并且受限于数据库的发展和所获取的数据量,部分的玻璃机器学习工作得到的模型的泛化能力和适用性都有待进一步提高。

4、公开号为cn108960493a的中国专利文献公开了玻璃材料性能的预测模型建立及预测方法、装置,该方法将获取的玻璃材料配方数据及多种性能数据构成预测数据库;从预测数据库中筛选训练数据,根据训练数据进行预测模型构建,生成预测模型;利用准确的预测模型对大量实验数据进行预测,根据预测调控配方。然而该方法建立的预测模型无法指导实验配方设计,待测玻璃材料的配方数据仍只能由人为经验设计或采取贪心策略进行广泛预测。

5、公开号为cn110364231a的中国专利文献公开了预测玻璃体系性质的方法,该专利技术从原子层面出发,基于密度泛函理论,提出原子-化合物-玻璃结构与性质结合的从微观到宏观的多尺度融合实现玻璃材料性质的定量研究,结合第一性原理结构筛选、绘制成分三角形得到玻璃体系组成图,利用玻璃体系组成图找到目标玻璃的结构基因,依据玻璃体系结构基因的性质,运用杠杆模型公式定量研究预测目标玻璃的性质。然而该方法过程复杂,计算资源消耗大,仅适用于低维玻璃体系的性能预测,且杠杆原理本身的预测准确度无法衡量和保证。


技术实现思路

1、本专利技术基于玻璃数据库和机器学习算法构建了可解释的高维空间预测模型,提供了一种基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,高维空间预测模型的泛化性能好,适用性广泛,能够实现对待测氧化物玻璃目标性能的批量、快速、精准预测,对高维空间预测模型的可解释性研究有助于进行目标性能玻璃组分反向设计。

2、具体采用的技术方案如下:

3、一种基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,包括以下步骤:

4、步骤1:采集氧化物玻璃的性能数据,构建初始样本集,所述的初始样本集包括具有映射关系的氧化物玻璃组分和其对应的性能值,所述的氧化物玻璃组分以摩尔百分含量计;

5、步骤2:对所述的初始样本集进行数据清洗,数据清洗包括无效样本剔除,特征降维和极端值样本剔除;

6、步骤3:以步骤2数据清洗后的样本集中的氧化物玻璃组分为模型的输入,以对应的性能值为模型的输出,划分训练集、测试集,基于随机森林算法在高维特征空间建立预测模型,利用训练集结合交叉验证技术和网格寻优算法进行模型超参数寻优以及模型训练,利用测试集评估模型的预测效果以及泛化性能,训练得到参数优化后的高维空间预测模型;

7、步骤4:对参数优化后的高维空间预测模型进行可解释性研究;

8、步骤5:基于步骤4的可解释研究结果进行目标性能玻璃组分设计,筛选目标性能玻璃氧化物组成的种类和范围,再使用步骤3中得到的参数优化后的高维空间预测模型预测氧化物玻璃的性能。

9、优选的,所述的性能数据包括但不限于密度、线热膨胀系数、硬度、杨氏模量、玻璃转变温度和玻璃应变点温度等。

10、优选的,步骤2的数据清洗包括如下步骤:

11、无效样本剔除:去除初始样本集中氧元素含量<30%的样本;

12、特征降维:去除初始样本集中含有h、s、c、n、pt、ag、au、cu、mn、f、cl、br、i、ru、rh、pd、pm、re、os、ir、hg、po和u元素的样本并剔除重复样本;上述元素可能容易挥发,或在玻璃网络中占据氧的位置,或在样本集中出现频率极低且含量极少,因此剔除含上述元素的样本;

13、极端值样本剔除:通过3σ原则剔除性能数据异常值对应的样本,3σ原则基于高斯分布,偏离均值三倍标准差的数据被判定为异常值。

14、具体的,步骤3中以模型中的决策树量、每颗决策树的训练样本数和特征集尺寸为超参数,设定每个超参数的搜索空间,穷举出各个超参数所有可能的组合结果生成“网格”,并依次基于k-fold交叉验证技术进行评估,在综合考虑模型的偏差和方差的情况下选择出最优的超参数组合。

15、k-fold交叉验证技术将初始训练集划分为k个子集,选择其中一个子集作为验证集,使用剩余的k-1个子集进行模型训练,这个过程重复k次,直到每个子集都被用作验证集,采用k个验证集的评估指标得分的平均值衡量该组超参数下的模型表现。

16、优选的,以平均绝对误差mae和决定系数r2为模型评估指标,在执行网格寻优算法的过程中,对于线性度较好的玻璃性能,模型中决策树量设定为[1,100],对于线性度较差的玻璃性能,模型中决策树量应大于100,k-fold交叉验证技术中k的取值为5或10。

17、优选的,步骤4中,可解释性研究包括随机森林模型内置的置换特征重要性分析,具体的,

18、设置随机森林中决策树的数量n;

19、对单棵决策树的袋外数据计算袋外误差,记作error1;对该袋外数据所有样本的某一特征x加入随机噪声,再次计算该决策树的袋外误差,记为error2;

20、特征x的重要性得分scorex计算公式为:

21、

22、式中,scorex表示重要性得分,n表示决策树的数量;对于特征x,若引入噪声后,其重要性得分scorex较高,说明由该特征引起的袋外误差变大,表明该特征的重要性比较高。

23、随机森林特征重要性分析只能给出特征的重要性排序而无法得知该特征影响模型预测结果的方向,因此需要结合shap进行可解释性分析,研究特征对于模型预测结果的影响。

24、步骤4中,可解释性研究还包括利用shap分析解释模型的输出,通过计算特征的shapley值,研究特征对于模型预测结果的影响(特征氧化物对性能预测的起作用方式)。shap分析(shapley additive explanations)本文档来自技高网...

【技术保护点】

1.一种基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,所述的性能数据包括密度、线热膨胀系数、硬度、杨氏模量、玻璃转变温度或玻璃应变点温度。

3.根据权利要求1所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,步骤2的数据清洗包括如下步骤:

4.根据权利要求1所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,具体的,步骤3中以模型中的决策树量、每颗决策树的训练样本数和特征集尺寸为超参数,设定每个超参数的搜索空间,穷举出各个超参数所有可能的组合结果生成“网格”,并依次基于k-fold交叉验证技术进行评估,在综合考虑模型的偏差和方差的情况下选择出最优的超参数组合。

5.根据权利要求4所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,k-fold交叉验证技术将初始训练集划分为k个子集,选择其中一个子集作为验证集,使用剩余的k-1个子集进行模型训练,这个过程重复k次,直到每个子集都被用作验证集,采用k个验证集的评估指标得分的平均值衡量该组超参数下的模型表现。

6.根据权利要求4所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,以平均绝对误差MAE和决定系数R2为模型评估指标,k-fold交叉验证技术中k的取值为5或10。

7.根据权利要求1所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,步骤4中,可解释性研究包括随机森林模型内置的置换特征重要性分析,具体的,

8.根据权利要求1所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,步骤4中,可解释性研究还包括利用SHAP分析解释模型的输出,通过计算特征的Shapley值,研究特征对于模型预测结果的影响。

9.根据权利要求1所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,Shapley值的计算公式为:

...

【技术特征摘要】

1.一种基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,所述的性能数据包括密度、线热膨胀系数、硬度、杨氏模量、玻璃转变温度或玻璃应变点温度。

3.根据权利要求1所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,步骤2的数据清洗包括如下步骤:

4.根据权利要求1所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,具体的,步骤3中以模型中的决策树量、每颗决策树的训练样本数和特征集尺寸为超参数,设定每个超参数的搜索空间,穷举出各个超参数所有可能的组合结果生成“网格”,并依次基于k-fold交叉验证技术进行评估,在综合考虑模型的偏差和方差的情况下选择出最优的超参数组合。

5.根据权利要求4所述的基于可解释的高维空间预测模型的氧化物玻璃性能预测方法,其特征在于,k-fold交叉验证技术将初始训练集划分为k个...

【专利技术属性】
技术研发人员:韩高荣田静李苑刘涌郑际杰陈家睿
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1