一种基于机器学习高效预测半导体材料带隙的方法技术

技术编号:34103022 阅读:27 留言:0更新日期:2022-07-11 23:52
本发明专利技术公开了一种基于机器学习高效预测半导体带隙的方法,包括建立样本集、数据预处理并选出建模的特征子集、划分训练集和测试集、构建高效预测模型、预测测试集样本的带隙,实现快速预测半导体的带隙。本发明专利技术通过来源于文献和数据库中的样本数据,建立了高效的预测模型,具有简单便捷、成本低廉、绿色环保的优点。使用本发明专利技术的机器学习模型预测半导体的带隙,通过开发出新的且具有创新性的描述符,其潜在的物理模型可以帮助研究人员设计特定带隙值的半导体新材料,节约实验和计算的时间和资源,提高实验的效率,避免盲目性,能够应用于使用很多描述符且关联性不强的复杂机器学习问题的解决,提高材料研发效率。提高材料研发效率。提高材料研发效率。

【技术实现步骤摘要】
一种基于机器学习高效预测半导体材料带隙的方法


[0001]本专利技术涉及半导体材料的带隙性能领域的应用,是一种基于机器学习高效预测半导体材料带隙的方法,该方法构建了一类富有创新性的机器学习描述符,可以高效准确地预测半导体材料的带隙,能够应用于使用很多描述符且关联性不强的复杂机器学习问题的解决。

技术介绍

[0002]带隙是表征半导体和绝缘体用于光学和电子应用的简单而重要的参数。由于准确测量带隙需要高质量的单晶,所以从实验获得的带隙数据非常少。随着计算机技术的进步,第一性原理方法成为计算大量化合物带隙的常用方法。大部分材料的电子结构都是基于密度泛函理论计算,将得到的Kohn

Sham带隙,即最低未占据和最高占据能量特征值之间的差异作为近似带隙.但由于理论局限,基于第一性原理计算出的带隙往往都小于真实值。为了获得更准确的带隙,经常采用一些更复杂的方法,例如基于多体扰动理论的GW方法。但高精度的G0W0计算耗时长,占用资源多,计算的体系原子数较少。因此,希望寻找一种在计算成本上可承受且能较为准确估计带隙的替代方法。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习高效预测半导体材料带隙的方法,其特征在于,包括如下步骤:1)建立数据集:从文献和数据库中收集半导体材料的带隙数据和其他特征的数据,作为机器学习的数据集样本。2)对数据进行预处理并选出建模的特征子集:将所述步骤1)中的数据集进行预处理,对缺损数值的样本数据进行删除,通过开发一类富有创新性的机器学习描述符,并将完整的数据样本值进行皮尔逊相关系数分析,找到与带隙相关性强的特征,作为建模的特征子集。3)将所述步骤2)中得到的特征子集样本按4:1的比例,随机划分为训练集和测试集。4)构建高效预测模型:通过比较四种机器学习算法,即Bagging,ET,RF,GBR,找到了一种最为稳定且高效的集成学习方法,利用此方法和步骤3)中得到的训练集进行建模,得到最优的半导体带隙预测模型。5)预测测试集样本的带隙:根据在所述步骤5)中建立的半导体带隙的预测模型,预测在所述步骤4)中得到的测试集样本的带隙。2.根据权利要求1所述的基于机器学习快速预测半导体材料带隙的方法,在所述步骤2)中开发一类富有创新性的机器学习描述符的原理如下:通过XPS和材料带隙之间的紧密关联性,在二元化合物半导体材料对应元素的s轨道和p轨道基础上获得了一类未被开发的且具有创新性的描述符。为了便于后续表达,本发明中的s轨道和p轨道的能级数值分别用符号s,p来表示。详细的创建方法如下:首先,二元化合物中对应位置的元素,其s,p值从专门...

【专利技术属性】
技术研发人员:王建伟邓文慧
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1