一种获取材料计算数据的方法技术

技术编号:22308154 阅读:18 留言:0更新日期:2019-10-16 08:15
本申请公开了一种获取材料计算数据的方法,包括:接收材料计算结果文件,所述材料计算结果文件中包含多种类型的数据文件;根据预设材料计算标签与数据文件类型的对应关系信息,确定每个预设材料计算标签对应的数据文件;根据预设材料计算标签对应的数据文件以及数据文件对应的关键词,从相应数据文件中提取出归属于材料计算标签的材料计算数据;基于衍生算法库为材料计算数据匹配衍生运算模型,通过匹配到的衍生运算模型对获取的材料计算数据进行衍生运算,从而衍生出更多的材料计算数据。本申请解决了材料计算结果文件中由于包含多种类型的数据文件,关键材料计算数据隐藏于这些文件中不易获取,并很难衍生出更多材料计算数据的技术难题。

A method of obtaining material calculation data

【技术实现步骤摘要】
一种获取材料计算数据的方法
本申请涉及数据获取领域,具体而言,涉及一种获取材料计算数据的方法及其装置。
技术介绍
随着大数据和人工智能的普及和应用,越来越多的高校和科研院所将人工智能技术应用于新材料的研发上,以弥补传统方法的不足。在新材料的研发领域,材料实验数据稀缺是较为常见的问题,利用人工智能中的材料计算模拟进行数据的衍生计算,通常可以弥补很多材料实验数据的不足。采用材料计算中的VASP第一性原理计算就可以获取不少的材料晶体结构信息和物化性质数据。想要基于VASP第一性原理计算进一步获取材料计算数据,需要对相应的第一性原理计算输出文件进行处理。而第一性原理计算的结算文件中包含多种类型的数据文件,且不同格式的数据文件所包含的参数和涉及的运算方法不同,导致从第一性原理计算的结果文件中获取参数并分析数据的操作过程繁琐、计算数据处理方法复杂极易出错。经过上述处理后,也只能获取最基本的物化性质数据。更多的材料物化性质数据需要进一步衍生才能得到。此外,VASP第一性原理计算结果数据往往分散于各超算中心或用户的个人电脑里,不能集中有效管理形成数据资产,也不能共享,随着时间流逝很容易丢失和遗忘,造成浪费。如果能将这些不同时间、不同阶段大量离散的第一性原理计算结果数据集中处理,并对它们集中衍生,便能对快速获取材料的大量计算数据。因此需要一种可以解决材料计算结果文件中包含多种类型的数据文件,快速获取材料计算数据并衍生出更多物化性质数据的方法。
技术实现思路
本申请的主要目的在于提供一种获取材料计算数据的方法,解决了材料计算结果文件中由于包含多种类型的数据文件,关键材料计算数据隐藏于这些文件中不易获取,并很难衍生出更多材料计算数据的技术难题。为了实现上述目的,提供了一种获取材料计算数据的方法,包括:接收材料计算结果文件,所述材料计算结果文件中包含多种类型的数据文件;根据预设材料计算标签与数据文件类型的对应关系信息,确定每个预设材料计算标签对应的数据文件;根据预设材料计算标签对应的数据文件以及所述数据文件对应的关键词,从相应数据文件中提取出归属于所述材料计算标签的材料计算数据;基于衍生算法库为所述材料计算数据匹配衍生运算模型,通过匹配到的衍生运算模型对所述材料计算数据进行衍生运算,得到衍生的材料计算数据。进一步的,所述材料计算数据为VASP第一性原理计算的结果数据,所述材料计算标签包括与VASP第一性原理计算对应的晶体结构优化标签、力学性质计算标签、光学性质计算标签和磁学性质计算标签;所述根据预设材料计算标签与数据文件类型的对应关系信息,确定每个预设材料计算标签对应的数据文件,包括:所述晶体结构优化标签、力学性质计算标签、光学性质计算标签和磁学性质计算标签对应的数据文件包括:输出VASPRUN文件、计算参数INCAR文件、输出OUTCAR文件和积分路径KPOINTS文件。进一步的,所述材料计算标签还包括与第一性原理计算对应的静态计算标签、能带计算标签和态密度计算标签;所述根据预设材料计算标签与数据文件类型的对应关系信息,确定每个预设材料计算标签对应的数据文件,包括:所述静态计算标签对应数据文件包括VASPRUN文件、INCAR文件、OUTCAR文件、KPOINTS文件和OSZICAR文件;所述能带计算标签对应数据文件包括VASPRUN文件、INCAR文件、OUTCAR文件、KPOINTS文件和EIGENVAL文件;所述态密度计算标签对应数据文件包括VASPRUN文件、INCAR文件、OUTCAR文件、KPOINTS文件和DOSCAR文件。进一步的,所述根据预设材料计算标签对应的数据文件以及所述数据文件对应的关键词,从相应数据文件中提取出归属于所述材料计算标签的材料计算数据,包括:从所述INCAR文件中提取关键计算控制参数;根据材料计算标签,从所述KPOINTS文件中获得KPointPath或KPointGrid值;从所述VASPRUN文件或OUTCAR文件中提取材料结构信息和材料计算数据。进一步的,在从所述VASPRUN文件或OUTCAR文件中提取材料结构信息后,判断存储所述材料计算数据的数据库中是否存在相同的材料结构信息,如果不存在,则将所述材料结构信息存储到所述数据库中。进一步的,所述判断存储所述材料计算数据的数据库中是否存在相同的材料结构信息,包括:根据材料结构信息中包含的化学表达式、晶格参数和原子占位信息进行哈希运行,得到哈希值;判断所述数据库中是否存在相同的所述哈希值,如果存在,则数据库中存在相同的材料结构信息;否则,判断数据库中不存在相同的材料结构信息。进一步的,所述基于衍生算法库为所述材料计算数据匹配衍生运算模型,包括:根据所述衍生算法库中的衍生运算模型能够处理的材料计算数据,从所述衍生算法库中筛选能够对所述材料计算数据进行衍生运算的衍生算法模型。进一步的,在接收材料计算结果文件后,确定每个预设材料计算标签对应的数据文件前,还包括:判断接收到的材料计算结果文件的是否完整,如果不完整,则进行异常告警;如果完整,则对所述材料计算结果文件进行重复性检查,过滤重复的文件。进一步的,所述判断接收到的材料计算结果文件的是否完整,包括:对接收到的计算结果文件的节点进行分析,根据节点的分析结果判断所述接收到的计算结果文件中的VASPRUN文件、OUTCAR文件、INCAR文件和KPOINTS文件是否完整。进一步的,所述对所述材料计算结果文件进行重复检查,避免从同一VASP第一性原理计算结果文件重复获取计算数据,至少包括:获取VASPRUN文件中<modelling><generator>节点中的date和time数据,获取OUTCAR文件中TotalCPUtimeused(sec),Usertime,Systemtime,Elapsedtime数据,共同运算得到哈希值,与数据库中的哈希值进行校验判断;如果相同,则视为重复文件。在本申请实施例中,采用建立一种获取材料计算数据的方法,基于预设材料计算标签的设置和数据文件对应的关键词,对材料计算结果文件中多种类型的数据文件的材料计算数据进行提取,通过衍生算法库匹配到的衍生运算模型对材料计算数据进行衍生运算,得到衍生的材料计算数据。从而实现了简化获取衍生的材料计算数据过程,达到通过计算使材料物化性质数据获取更加便捷的技术效果,进而解决了材料计算结果文件中由于包含多种类型的数据文件,关键材料计算数据隐藏于这些文件中不易获取,并很难衍生出更多材料计算数据的技术难题。同时,因为对材料计算结果文件中不同类型的数据进行了分别的处理,后续又对材料计算结果文件进行细致的完整性和重复性的校正,可更好的避免因材料计算结果文件不完整导致的材料计算结果文件部分无法使用,整体数据排查困难的问题;如此解决了大批量计算结果文件处理容易出错的问题,可实现对大量的材料计算结果文件进行一键式集中处理,达到可快速获取更多材料物化性质数据的目的。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是本申请获取材料计算数据的方法的流程示意图;图2是本文档来自技高网...

【技术保护点】
1.一种获取材料计算数据的方法,其特征在于,包括:接收材料计算结果文件,所述材料计算结果文件中包含多种类型的数据文件;根据预设材料计算标签与数据文件类型的对应关系信息,确定每个预设材料计算标签对应的数据文件;根据预设材料计算标签对应的数据文件以及所述数据文件对应的关键词,从相应数据文件中提取出归属于所述材料计算标签的材料计算数据;基于衍生算法库为所述材料计算数据匹配衍生运算模型,通过匹配到的衍生运算模型对所述材料计算数据进行衍生运算,得到衍生的材料计算数据。

【技术特征摘要】
1.一种获取材料计算数据的方法,其特征在于,包括:接收材料计算结果文件,所述材料计算结果文件中包含多种类型的数据文件;根据预设材料计算标签与数据文件类型的对应关系信息,确定每个预设材料计算标签对应的数据文件;根据预设材料计算标签对应的数据文件以及所述数据文件对应的关键词,从相应数据文件中提取出归属于所述材料计算标签的材料计算数据;基于衍生算法库为所述材料计算数据匹配衍生运算模型,通过匹配到的衍生运算模型对所述材料计算数据进行衍生运算,得到衍生的材料计算数据。2.根据权利要求1所述的获取材料计算数据的方法,其特征在于:所述材料计算数据为VASP第一性原理计算的结果数据,所述材料计算标签包括与VASP第一性原理计算对应的晶体结构优化标签、力学性质计算标签、光学性质计算标签和磁学性质计算标签;所述根据预设材料计算标签与数据文件类型的对应关系信息,确定每个预设材料计算标签对应的数据文件,包括:所述晶体结构优化标签、力学性质计算标签、光学性质计算标签和磁学性质计算标签对应的数据文件包括:输出VASPRUN文件、计算参数INCAR文件、输出OUTCAR文件和积分路径KPOINTS文件。3.根据权利要求2所述的获取材料计算数据的方法,其特征在于:所述材料计算标签还包括与第一性原理计算对应的静态计算标签、能带计算标签和态密度计算标签;所述根据预设材料计算标签与数据文件类型的对应关系信息,确定每个预设材料计算标签对应的数据文件,包括:所述静态计算标签对应数据文件包括VASPRUN文件、INCAR文件、OUTCAR文件、KPOINTS文件和OSZICAR文件;所述能带计算标签对应数据文件包括VASPRUN文件、INCAR文件、OUTCAR文件、KPOINTS文件和EIGENVAL文件;所述态密度计算标签对应数据文件包括VASPRUN文件、INCAR文件、OUTCAR文件、KPOINTS文件和DOSCAR文件。4.根据权利要求2或3所述的获取材料计算数据的方法,其特征在于,所述根据预设材料计算标签对应的数据文件以及所述数据文件对应的关键词,从相应数据文件中提取出归属于所述材料计算标签的材料计算数据,包括:从所述INCAR文件中提取关键计算控制参数;根据材料计算标签,从所述KPOINTS文件中获得KPointPath或KPointGrid值;从所述VASPR...

【专利技术属性】
技术研发人员:曾凡
申请(专利权)人:苏州迈高材料基因技术有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1