一种兰炭基多孔碳吸附重金属效率预测方法及相关装置制造方法及图纸

技术编号:33556063 阅读:16 留言:0更新日期:2022-05-26 22:52
本发明专利技术公开一种兰炭基多孔碳吸附重金属效率预测方法及相关装置,本发明专利技术先通过模块MLDPU对兰炭基多孔碳的缺失值进行填充。然后对填充效果进行判定,选择填充效果最好的一种模式。以填充完整的数据集为预测数据集,然后利用XGBoost模块对填充完整的兰炭基多孔碳吸附重金属效率进行预测。使用本发明专利技术的预测方法可以适配任何类型含缺失值的实际兰炭基多孔碳吸附数据集,并针对不同的数据集高效、快速预测出兰炭基多孔碳对重金属的吸附效率,指导实际生产应用。实际生产应用。实际生产应用。

【技术实现步骤摘要】
一种兰炭基多孔碳吸附重金属效率预测方法及相关装置


[0001]本专利技术涉及机器学习
和碳基吸附材料领域,尤其涉及一种兰炭基多孔碳吸附重金属效率预测方法及相关装置。

技术介绍

[0002]近年来,随着工业的快速发展,产生大量的重金属废水。废水中的铅(Pb)、镉(Cd)、镍(Ni)、砷(As)、铜(Cu)和锌(Zn)等重金属存在一定的毒性,且在环境中能够长期存在,会对人类健康和生态系统造成严重风险。
[0003]吸附法由于其具有效率高、可操作性强和成本低等优点,被认为是处理重金属废水的优良方法。目前,兰炭基多孔碳材料因其成本低、孔隙结构发达、制备工艺简单和价格低廉,被认为是最有前途的吸附材料之一。
[0004]在实际过程中,兰炭基多孔碳吸附材料可以用多种方法合成。通过不同的方法合成的吸附材料,吸附性能差异较大。且制备不同类型的兰炭基多孔碳及测试其对不同类型重金属的吸附性能是特别耗时耗力的。利用机器学习(Machine learning,ML)建立有针对性或泛化性能良好的模型来预测吸附材料的吸附性能,是吸附材料设计领域未来的发展趋势之一。但是在实际过程中,由于机器数据采集出错、人工记录失误等原因,使得获取的数据集大多数是不完整的,分析这些含缺失值的数据集会对最终结果产生一定的偏差,对吸附性能预测会造成很大的影响。同时,目前未有合适的兰炭基多孔碳材料吸附性能的预测模型。

技术实现思路

[0005]针对以上问题,本专利技术的目的在于提供一种兰炭基多孔碳吸附重金属效率预测方法及相关装置。本方法是一种基于MLDPU

XGBoost的算法,可以有效的解决实际研究过程中兰炭基多孔碳吸附相关数据存在缺失位点影响分析结果偏差的问题。在此基础上同时可以实现快速,高效预测兰炭基多孔碳吸附重金属效率。
[0006]本专利技术采用的技术方案如下:
[0007]一种兰炭基多孔碳吸附重金属效率预测方法,包括如下过程:
[0008]使用机器学习算法对实际生产过程中获取的兰炭基多孔碳材料吸附重金属的数据集进行缺失位点填充,得到补全所有缺失数据的兰炭基多孔碳材料的吸附数据集;
[0009]使用极限梯度提升算法(即XGBoost算法),利用所述兰炭基多孔碳材料的吸附数据集对兰炭基多孔碳吸附重金属效率进行预测。
[0010]优选的,使用机器学习算法对实际生产过程中获取的兰炭基多孔碳材料吸附重金属的数据集进行缺失位点填充,得到补全所有缺失数据的兰炭基多孔碳材料的吸附数据集,包括如下步骤:
[0011]S1.1,获取实际生产过程中兰炭基多孔碳吸附重金属的相关数据,将所述相关数据分类汇总,作为兰炭基多孔碳材料吸附重金属的原始数据集;
[0012]S1.2,对所述原始数据集进行EDA统计分析,去除所述原始数据集中的异常值,并对所述原始数据集每列进行编号,得到吸附原始数据集中每一列特征的数据缺失率;然后按编号以数据缺失率从小到大进行排序,形成新的填充顺序向量,以该新的填充顺序向量作为后续缺失数据填充顺序;
[0013]S1.3,按照所述缺失数据填充顺序,进行兰炭基多孔碳材料的吸附数据缺失值的填充,以缺失率最小的一列作为新的标签列,并以此列为标准进行兰炭基多孔碳材料吸附重金属的原始数据集数据的重新排序,按照有缺失值、无缺失值将该数据集划分为两个部分;将所述新的标签列不缺失部分对应的其他特征列的部分加对应的重金属的吸附效率列作为训练集特征列X_train,将所述新的标签列不缺失的部分作为训练集标签列Y_train,将训练集特征列X_train和训练集标签列Y_train组成的部分为训练集;所述新的标签列缺失部分对应的其他特征列的部分加对应的吸附效率作为测试集特征列X_test,所述新的标签列缺失的部分作为测试集标签列Y_test,将测试集特征列X_test和测试集标签列Y_test组成测试集;
[0014]S1.4,利所述训练集对模型库中的不同机器学习模型进行训练,然后使用测试集进行测试,并对不同机器学习模型进行评估,选出最佳的吸附数据填充模型;
[0015]S1.5,利用所述最佳的吸附数据填充模型对所述原始数据集进行缺失位点填充,得到补全所有缺失数据的兰炭基多孔碳材料的吸附数据集。
[0016]优选的,S1.1中,所述原始数据集的数据类型包括:兰炭的工业分析和元素分析数据、制备过程中的加热时间数据、制备过程中的加热速率数据、吸附过程中吸附溶液的pH数据、吸附过程中吸附溶液的重金属初始浓度数据和吸附过程的吸附时间数据中的至少一项以及兰炭基多孔碳对重金属的吸附效率。
[0017]优选的,S1.4中,对不同机器学习模型进行评估时,以决策系数R2和均方误差MSE对不同机器学习模型进行评估,并根据初步模型性能评分,利用网格搜索和学习曲线对机器学习模型超参数进行调参,得到最优超参数,利用最优超参数选出最佳的吸附数据填充模型。
[0018]优选的,S1.5中,利用所述最佳的吸附数据填充模型对所述原始数据集进行缺失位点填充时,按所述缺失数据填充顺序重复所述S1.3,进行遍历填充,直至填充完所有数据。
[0019]优选的,使用极限梯度提升算法(即XGBoost算法),利用所述兰炭基多孔碳材料的吸附数据集对兰炭基多孔碳吸附重金属效率进行预测,包括如下过程:
[0020]将补全所有缺失数据的兰炭基多孔碳材料的吸附数据集划分为训练集和测试集,初步建立XGBoost模型,对XGBoost模型进行实例化,通过所述训练集对XGBoost模型进行训练,获得兰炭基多孔碳重金属吸附效率预测的XGBoost初步模型;
[0021]利用所述测试集对所述XGBoost初步模型进行测试,根据测试结果,对所述XGBoost初步模型的超参数进行调参,确定最优超参数,根据所述最优超参数得到最佳的兰炭基多孔碳重金属吸附效率预测的XGBoost模型;
[0022]利用所述最佳的兰炭基多孔碳重金属吸附效率预测的XGBoost模型和实际生产过程中获取的兰炭基多孔碳材料吸附重金属的数据对兰炭基多孔碳吸附重金属效率进行预测。
[0023]优选的,初步建立的XGBoost模型如下:
[0024][0025]其中,代表初步建立模型的预测结果,i代表兰炭基多孔碳材料吸附重金属原始数据集中的样本i,K代表树的总数量,k代表第k棵树,f
k
(x
i
)代表叶子权重,x
i
代表样本i对应的特征向量;
[0026]XGBoost模型的目标函数Obj如下:
[0027][0028]其中,i代表数据集中的第i个样本,n代表导入第k棵树的数据总量,y
i
代表原数据集第i个样本点的实际数值,代表原数据集样本点i预测数值,l()代表传统损失函数,Ω()代表模型复杂度;
[0029]对所述XGBoost初步模型的超参数进行调参,确定最优超参数时,利用网格搜索和学习曲线对XGBoost初步模型的超参数进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种兰炭基多孔碳吸附重金属效率预测方法,其特征在于,包括如下过程:使用机器学习算法对实际生产过程中获取的兰炭基多孔碳材料吸附重金属的数据集进行缺失位点填充,得到补全所有缺失数据的兰炭基多孔碳材料的吸附数据集;使用极限梯度提升算法,利用所述兰炭基多孔碳材料的吸附数据集对兰炭基多孔碳吸附重金属效率进行预测。2.根据权利要求1所述的一种兰炭基多孔碳吸附重金属效率预测方法,其特征在于,使用机器学习算法对实际生产过程中获取的兰炭基多孔碳材料吸附重金属的数据集进行缺失位点填充,得到补全所有缺失数据的兰炭基多孔碳材料的吸附数据集,包括如下步骤:S1.1,获取实际生产过程中兰炭基多孔碳吸附重金属的相关数据,将所述相关数据分类汇总,作为兰炭基多孔碳材料吸附重金属的原始数据集;S1.2,对所述原始数据集进行EDA统计分析,去除所述原始数据集中的异常值,并对所述原始数据集每列进行编号,得到吸附原始数据集中每一列特征的数据缺失率;然后按编号以数据缺失率从小到大进行排序,形成新的填充顺序向量,以该新的填充顺序向量作为后续缺失数据填充顺序;S1.3,按照所述缺失数据填充顺序,进行兰炭基多孔碳材料的吸附数据缺失值的填充,以缺失率最小的一列作为新的标签列,并以此列为标准进行所述原始数据集数据的重新排序,按照有缺失值、无缺失值将该数据集划分为两个部分;将所述新的标签列不缺失部分对应的其他特征列的部分加对应的重金属的吸附效率列作为训练集特征列,将所述新的标签列不缺失的部分作为训练集标签列,将训练集特征列和训练集标签列组成训练集;所述新的标签列缺失部分对应的其他特征列的部分加对应的吸附效率作为测试集特征列,所述新的标签列缺失的部分作为测试集标签列,将测试集特征列和测试集标签列组成测试集;S1.4,利所述训练集对模型库中的不同机器学习模型进行训练,然后使用测试集进行测试,并对不同机器学习模型进行评估,选出最佳的吸附数据填充模型;S1.5,利用所述最佳的吸附数据填充模型对所述原始数据集进行缺失位点填充,得到补全所有缺失数据的兰炭基多孔碳材料的吸附数据集。3.根据权利要求2所述的一种兰炭基多孔碳吸附重金属效率预测方法,其特征在于,S1.1中,所述原始数据集的数据类型包括:兰炭的工业分析和元素分析数据、制备过程中的加热时间数据、制备过程中的加热速率数据、吸附过程中吸附溶液的pH数据、吸附过程中吸附溶液的重金属初始浓度数据和吸附过程的吸附时间数据中的至少一项以及兰炭基多孔碳对重金属的吸附效率。4.根据权利要求2所述的一种兰炭基多孔碳吸附重金属效率预测方法,其特征在于,S1.4中,对不同机器学习模型进行评估时,以决策系数和均方误差对不同机器学习模型进行评估,并根据初步模型性能评分,利用网格搜索和学习曲线对机器学习模型超参数进行调参,得到最优超参数,利用最优超参数选出最佳的吸附数据填充模型。5.根据权利要求2所述的一种兰炭基多孔碳吸附重金属效率预测方法,其特征在于,S1.5中,利用所述最佳的吸附数据填充模型对所述原始数据集进行缺失位点填充时,按所述缺失数据填充顺序重复所述S1.3...

【专利技术属性】
技术研发人员:周军师印光吴雷杨波杜帅杨茸茸平松
申请(专利权)人:西安建筑科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1