【技术实现步骤摘要】
一种基于机器学习高效预测半导体材料带隙的方法
[0001]本专利技术涉及半导体材料的带隙性能领域的应用,是一种基于机器学习高效预测半导体材料带隙的方法,该方法构建了一类富有创新性的机器学习描述符,可以高效准确地预测半导体材料的带隙,能够应用于使用很多描述符且关联性不强的复杂机器学习问题的解决。
技术介绍
[0002]带隙是表征半导体和绝缘体用于光学和电子应用的简单而重要的参数。由于准确测量带隙需要高质量的单晶,所以从实验获得的带隙数据非常少。随着计算机技术的进步,第一性原理方法成为计算大量化合物带隙的常用方法。大部分材料的电子结构都是基于密度泛函理论计算,将得到的Kohn
‑
Sham带隙,即最低未占据和最高占据能量特征值之间的差异作为近似带隙.但由于理论局限,基于第一性原理计算出的带隙往往都小于真实值。为了获得更准确的带隙,经常采用一些更复杂的方法,例如基于多体扰动理论的GW方法。但高精度的G0W0计算耗时长,占用资源多,计算的体系原子数较少。因此,希望寻找一种在计算成本上可承受且能较为准确估计带隙的替代方 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习高效预测半导体材料带隙的方法,其特征在于,包括如下步骤:1)建立数据集:从文献和数据库中收集半导体材料的带隙数据和其他特征的数据,作为机器学习的数据集样本。2)对数据进行预处理并选出建模的特征子集:将所述步骤1)中的数据集进行预处理,对缺损数值的样本数据进行删除,通过开发一类富有创新性的机器学习描述符,并将完整的数据样本值进行皮尔逊相关系数分析,找到与带隙相关性强的特征,作为建模的特征子集。3)将所述步骤2)中得到的特征子集样本按4:1的比例,随机划分为训练集和测试集。4)构建高效预测模型:通过比较四种机器学习算法,即Bagging,ET,RF,GBR,找到了一种最为稳定且高效的集成学习方法,利用此方法和步骤3)中得到的训练集进行建模,得到最优的半导体带隙预测模型。5)预测测试集样本的带隙:根据在所述步骤5)中建立的半导体带隙的预测模型,预测在所述步骤4)中得到的测试集样本的带隙。2.根据权利要求1所述的基于机器学习快速预测半导体材料带隙的方法,在所述步骤2)中开发一类富有创新性的机器学习描述符的原理如下:通过XPS和材料带隙之间的紧密关联性,在二元化合物半导体材料对应元素的s轨道和p轨道基础上获得了一类未被开发的且具有创新性的描述符。为了便于后续表达,本发明中的s轨道和p轨道的能级数值分别用符号s,p来表示。详细的创建方法如下:首先,二元化合物中对应位置的元素,其s,p值从专门...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。