当前位置: 首页 > 专利查询>广州大学专利>正文

一种用于筛选金属有机框架吸附甲苯的机器学习方法技术

技术编号:38228980 阅读:11 留言:0更新日期:2023-07-25 17:58
本发明专利技术涉及MOF材料的设计和筛选领域,且公开了一种用于筛选金属有机框架吸附甲苯的机器学习方法;从材料晶体数据库中随机筛选多个MOF,利用巨正则模特卡洛方法,模拟计算出对甲苯污染物吸附量;采用库伦矩阵描述符构建甲苯结构和吸附量之间的定量关系;把数据集划分为测试集和训练集,采用五折交叉验证和外部验证,评估模型的鲁棒性和泛化能力;利用自动拓扑生成器AuToGraFS,计算配体位置,并从配体统计表sub_list中随机选取结构进行组合,生成新MOFs;对每个新生成的MOFs结构的进行库伦矩阵描述符,筛选出吸附量最佳的MOFs。筛选出吸附量最佳的MOFs。筛选出吸附量最佳的MOFs。

【技术实现步骤摘要】
一种用于筛选金属有机框架吸附甲苯的机器学习方法


[0001]本专利技术涉及MOF材料的设计和筛选领域,具体为一种用于筛选金属有机框架吸附甲苯污染物的机器学习方法。

技术介绍

[0002]水环境中的甲苯主要来源于自然界中的火山爆发、火灾中一些原油和植物的释放和人类活动制造所产生的包括汽油、交通以及有机溶剂的排放。甲苯是一种无色澄清液体且能与乙醇、乙醚、丙酮、氯仿等有机物混溶,微溶于水。甲苯的危害很大,对皮肤、粘膜有刺激性,对中枢神经系统有麻醉作用。因此,为确保供水安全,去除水中的甲苯污染物十分关键,而吸附法是目前最常用的方法,并且其关键是在于找到一种合适的吸附剂。
[0003]金属有机框架(Metal

organic frameworks,MOFs)材料由有机配体与金属离子通过网状合成连接,形成一个网状三维结构。因其具有孔隙度可调、高比表面积和结构功能变化多样性的特点已被广泛应用于吸附分离、气体储存、药物装载等。传统实验通过合成的MOFs材料再进行测试,具有一定的经验性且耗时耗力。且很难对大量的材料进行同时测试,容易造成一定的实验误差。因此,对MOFs材料的结构和吸附性能关系的探索有着重要的意义。
[0004]巨正则蒙特卡洛模拟方法,可对不同结构MOFs的吸附性能进行准确计算。但模拟吸附方法计算量大、需要大型服务器和速度慢,较难满足开发需求。机器学习可利用不同的算法,学习建模数据规律并能根据规律做出预测。因此,可用于具有高甲苯吸附性能的MOFs的筛选。同时,传统的筛选都是基于已合成的MOFs材料进行研究,很难全面的筛选可用的MOFs材料。材料的虚拟生成方法可根据材料的特征结构生成未报道的新材料,并筛选出一些潜在的具有高性能的新材料。为此,我们通过结合蒙特卡洛模拟、机器学习和虚拟筛选等手段,开发出了一种用于吸附甲苯的金属有机框架设计新方法。

技术实现思路

[0005](一)解决的技术问题
[0006]针对现有技术的不足,本专利技术提供了一种用于筛选金属有机框架吸附甲苯的机器学习方法,解决了上述的问题。
[0007](二)技术方案
[0008]为实现上述所述目的,本专利技术提供如下技术方案:一种用于筛选金属有机框架吸附甲苯的机器学习方法,包括以下步骤:
[0009]第一步:从材料晶体数据库中随机筛选多个MOF,利用巨正则模特卡洛方法,模拟计算出对甲苯污染物的吸附量;
[0010]第二步:采用库伦矩阵描述符构建甲苯结构与其吸附量之间的定量关系;
[0011]第三步:把数据集划分为测试集和训练集,采用五折交叉验证和外部验证,评估模型的鲁棒性和泛化能力;
[0012]第四步:采用多种机器学习方法构建最优吸附模型;
[0013]第五步:将描述符参数作为输入,利用训练好的模型预测测试集对应的吸附量值,并计算预测的准确程度,评价准确性的指标为决定系数R2;
[0014]第六步:利用框架结构的自动拓扑生成器AuToGraFS,根据统计的拓扑结构,并计算可结合配体的位点,随机抽取sbu_list的配体,进行组合生成新MOFs;
[0015]第七步:计算每个新生成的MOFs结构的库伦矩阵描述符,并通过构建的吸附模型,筛选出吸附量最佳的MOFs。
[0016]优选的,所述第三步的具体内容为:选机器学习算法,使用训练集对机器学习模型训练,同时通过调整模型的超参数,直至模型预测的能力准确性满足要求。
[0017]优选的,所述机器学习算法包括决策树、随机森林以及支持向量机。
[0018]优选的,所述第七步中的筛选出吸附量最佳的MOFs具体内容为:
[0019]通过建立的预测MOF对甲苯污染物吸附模型将新生成的MOFs进行筛选,筛选出吸附量最佳的前5个MOFs。
[0020](三)有益效果
[0021]与现有技术相比,本专利技术提供了一种用于筛选金属有机框架吸附甲苯的机器学习方法,具备以下有益效果:
[0022]1、该用于筛选金属有机框架吸附甲苯的机器学习方法,基于RASPA程序通过巨正则模特卡洛计算出吸附量,并通过库伦矩阵计算结构描述符,能够快速筛选具有较高甲苯吸附量的MOF,不仅效率高,且建立的机器学习模型也能使用于筛选其他材料,具有普遍性。对于开发、预测各种其他未知性能的MOF,提供了一种新的筛选工具。
[0023]2、该用于筛选金属有机框架吸附甲苯的机器学习方法,提供的筛选高甲苯吸附MOFs系统,相比于传统筛选所用的“试错法”,本方法更高效,可节省人力和物力,促进MOF材料的设计和筛选。
[0024]3、该用于筛选金属有机框架吸附甲苯的机器学习方法,基于统计学进行材料的预测和筛选,与传统实验相比,受外界影响因素较少,本专利技术方法得到的结果具有可靠性和普遍性,为后续MOF材料的构效关系研究提供了通用方法。
附图说明
[0025]图1是高甲苯吸附金属有机框架材料吸附剂的机器学习方法流程示意图;
[0026]图2是机器学习算法对甲苯吸附量计算值和预测值的对比图。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]请参阅图1

2,一种用于筛选金属有机框架吸附甲苯的机器学习方法,包括以下步骤:
[0029]第一步:从CoreMOFs数据库中随机筛选1000个MOFs,利用巨正则模特卡洛方法,模
拟计算出在298k,1.5Mpa条件下,对甲苯的吸附量;
[0030]第二步:采用金属有机框架材料的库伦矩阵描述符对甲苯的吸附量之间建立数据集;
[0031]第三步:把数据集划分为测试集和训练集,采用五折交叉验证和外部验证,评估模型的鲁棒性和泛化能力;
[0032]第四步:选机器学习算法包括不仅限于决策树、随机森林、支持向量机,使用训练集对机器学习模型训练,同时通过调整模型的超参数,直至模型预测的预测准确程度满足要求;
[0033]第五步:将描述符参数作为输入,利用训练好的模型预测测试集对应的吸附量值,并计算预测的准确程度,评价准确性的指标为决定系数R2;
[0034]第六步:利用框架结构的自动拓扑生成器AuToGraFS,根据统计的拓扑结构,共计2324个,每个随机生成10个新MOFs,共计生成23240个新MOFs;
[0035]第七步:将新生成的MOFs,计算每个结构的库伦矩阵描述符;
[0036]第八步:通过建立的预测甲苯吸附量模型将新生成的MOFs进行筛选,利用随机森林算法构建的机器学习模型其R2能达到0.95以上,模型效果优异。通过该模型筛选出吸附量最佳的前5个MOFs。
[0037]尽管已经示出和描述了本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于筛选金属有机框架吸附甲苯的机器学习方法,其特征在于,包括以下步骤:第一步:从材料晶体数据库中随机筛选多个MOF,利用巨正则模特卡洛方法,模拟计算出对甲苯污染物的吸附量;第二步:采用库伦矩阵描述符构建MOF结构和甲苯吸附量之间的定量关系;第三步:把数据集划分为测试集和训练集,采用五折交叉验证和外部验证,评估模型的鲁棒性和泛化能力;第四步:利用多种机器学习方法构建最优的吸附模型;第五步:将描述符参数作为输入,利用训练好的模型预测测试集对应的吸附量值,并计算预测的准确程度,评价准确性的指标为决定系数R2;第六步:利用框架结构的自动拓扑生成器AuToGraFS,根据统计的拓扑结构并计算配体位置,通过随机选取配体生成新MOFs;第七步:计算每个新生成的...

【专利技术属性】
技术研发人员:闫希亮何英刘国红闵维翠陈寒乐闫兵
申请(专利权)人:广州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1