一种基于异质集成学习的材料性能预测模型构建方法技术

技术编号:21432560 阅读:72 留言:0更新日期:2019-06-22 12:01
本发明专利技术涉及一种基于异质集成学习的材料性能预测模型构建方法,属于计算机与材料科学交叉技术领域。本发明专利技术通过机器学习中异质集成学习方法的Stacking方法构建一种材料性能预测模型,为材料的设计与制造提供一定的数据指导,提高新材料研发的效率,并降低研发周期与研发成本。本发明专利技术与现有技术相比,主要解决了目前材料基因工程中单模型预测的准确率较低,且泛化能力较弱等现象,通过Stacking集成学习方法将几种不同的机器学习模型集成为一个准确率高于基学习器的强预测模型(Stacking模型),再通过该模型对材料的性能进行预测。效果是:极大提高了预测准确率,提高了模型的泛化能力,有利于降低新材料研发成本。

【技术实现步骤摘要】
一种基于异质集成学习的材料性能预测模型构建方法
本专利技术涉及一种基于异质集成学习的材料性能预测模型构建方法,属于计算机与材料科学交叉

技术介绍
当前,面对竞争激励的制造业和快速的经济发展,材料科学家和工程师必须缩短新材料从发现到应用的研发周期,以期来解决21世纪的巨大挑战。然而,当前的新材料研发主要依据研究者的科学直觉和大量重复的“尝试法”实验。其实,有些实验是可以借助现有高效、准确的计算工具,然而,这种计算模拟的准确性依然很弱。制约材料研发周期的另一因素是从发现、发展、性能优化、系统设计与集成、产品论证及推广过程中涉及的研究团队间彼此独立,缺少合作和相互数据的共享以及材料设计的技术有待大幅度提升。《材料基因组计划》拟通过集成材料计算与计算机技术之间的协作,把材料研发周期减半,降低研发成本。机器学习作为现在应用最广泛的计算机领域的技术,成为了材料基因工程必不可少的辅助工具。目前,材料基因工程中的机器学习主要使用单个模型进行材料性能或化学结构的学习预测,而集成学习是某种规则把多个模型进行整合,从而获得比单个学习器更好的预测效果的一种机器学习方法。集成学习方法主要根据个体学习本文档来自技高网...

【技术保护点】
1.一种基于异质集成学习的材料性能预测模型构建方法,其特征在于:包括如下步骤:Step1、收集材料实验过程参数及通过这些过程参数所得的材料性能数据作为Stacking模型的数据集Data,并将数据集的70%作为训练数据集D_train,30%作为最终测试集D_test;Step2、通过异质集成学习Stacking方法将SVM(Support Vector Machine,支持向量机)、NBM(Naive Bayesian Model,朴素贝叶斯模型)、NN(Neural Networks,神经网络)三种机器学习算法模型作为基学习器组成初级学习器;Step3、将D_train分为训练部分和测试部...

【技术特征摘要】
1.一种基于异质集成学习的材料性能预测模型构建方法,其特征在于:包括如下步骤:Step1、收集材料实验过程参数及通过这些过程参数所得的材料性能数据作为Stacking模型的数据集Data,并将数据集的70%作为训练数据集D_train,30%作为最终测试集D_test;Step2、通过异质集成学习Stacking方法将SVM(SupportVectorMachine,支持向量机)、NBM(NaiveBayesianModel,朴素贝叶斯模型)、NN(NeuralNetworks,神经网络)三种机器学习算法模型作为基学习器组成初级学习器;Step3、将D_train分为训练部分和测试部分输入到初级学习器中对三个基学习器进行学习和拟合;Step4、将每个基学习器的训练集中作为测试集的部分数据集合并作为次级学习器的训练数据集对次级学习器进行训练;Step5、在Stacking模型训练完成后,将最终的测试数据集D_test输入Stacking模型中,经过初级学习器和次级学习器得到模型输出的材料性能参数;观察所得测试结果与测试集中已知的材料性能参数的拟合情况是否达到预设标准,若达到预设标准,则说明此异质集成学习Stacking模型搭建成功。2.根据权利要求1所述的一种基于异质集成学习的材料性能预测模型构建方法,其特征在于:所述Step3的数据集D_train的划分具体步骤如下:在初级学习器中,基于训练数据集D_train在初级学习器中采用3折交叉验证的方法,将每个基学习器所输入的训练数据集再次分割,其中2/3作为基学习器自身训练集B_train进行学习,1/3作为自身测试集进行测试拟合B_test。3.根据权利要求2所述的一种基于异质集成学习的材料性能预测模型构建方法,其特征在于:所述Step3的学习和拟合具体实施步骤如下:Step1、基于训练数据集B_train,分别输入到对应SVM、NBM、NN三种机器学习算法的三个基学习器Mt(t=1,2,3)中,得到三个基学习器的预测结果Zi(i=1,2,3),Step2、将三...

【专利技术属性】
技术研发人员:刘英莉牛琛沈韬朱艳
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1