当前位置: 首页 > 专利查询>平顶山学院专利>正文

随机森林辅助人工神经网络的LIBS定量分析方法技术

技术编号:20020860 阅读:40 留言:0更新日期:2019-01-06 01:59
本发明专利技术涉及一种随机森林辅助人工神经网络的LIBS定量分析方法,具体为:1、使用LIBS对n个标准样品采集光谱数据;2、得到内标后的光谱变量;3、对光谱变量进行权重标定,得到平均权重值;4、以平均权重值作为选择光谱变量的标准,并利用标准样品中被分析元素的已知含量,对人工神经网络进行训练,获得人工神经网络分析模型和被分析元素的最优光谱变量集的构成规则;5、使用LIBS采集被测物的光谱,并得到内标后的光谱变量,按照最优光谱变量集的构成规则构建被测物的光谱变量集;6、将被测物的光谱变量集中的光谱变量作为输入值代入人工神经网络分析模型,输出被测物中被分析元素的含量。本发明专利技术具有较高的准确度。

【技术实现步骤摘要】
随机森林辅助人工神经网络的LIBS定量分析方法(一)、
:本专利技术涉及一种成分分析方法,特别涉及一种随机森林辅助人工神经网络的LIBS定量分析方法。(二)、
技术介绍
:LIBS(laser-inducedbreakdownspectroscopy,激光诱导击穿光谱)是一种原子发射光谱技术,它利用高强度脉冲激光烧蚀样品产生等离子体,通过采集分析等离子体发射光谱,得到样品中元素种类及含量。LIBS技术具有可快速检测,较少或不需样品制备,较低的样品损耗,可在线、原位检测,可分析多种物态等优点,越来越广泛地应用于生物医学,冶金,环境监测,文物分析鉴定,太空探索和能源开发等诸多领域。最常用的LIBS定量分析方法是校准曲线法,即使用被分析元素的某条谱线强度与校准样品中该元素的含量建立校准曲线,然后依据被测物中该元素的谱线强度由校准曲线求得被测物中该元素含量。校准曲线法虽然在一定程度上能减弱等离子体光谱波动带来的影响,但其分析准确度和精密度仍然不高,难以得到令人满意的结果。LIBS光谱不稳定且受多种因素影响,校准曲线分析法使用很少的光谱信息,无法精确地反映元素含量和光谱变量之间的映射关系,从而限制了LIBS分析准确度的提高。(三)、
技术实现思路
:本专利技术要解决的技术问题是:提供一种随机森林辅助人工神经网络的LIBS定量分析方法,该分析方法具有较高的准确度。本专利技术的技术方案:一种随机森林辅助人工神经网络(Random-forest-assistingartificial-neural-network,简称RFA-ANN)的LIBS定量分析方法,具体为:第1步、光谱数据的采集:选用n个和被测物基体构成尽可能一致的标准样品,n个标准样品中被分析元素含量已知且各不相同,使用LIBS系统对n个标准样品采集光谱数据;n为大于1的自然数;第2步、对光谱数据进行内标处理:按照内标法的标准找到一种内标元素的m条谱线作为内标线,m为大于等于1的自然数;对于每个标准样品的每幅光谱进行如下操作:当m等于1时,用这一条内标线对所有光谱进行内标处理,即所有光谱的强度分别除以这一条内标线的强度,得到的比值作为内标后的光谱变量;当m大于1时,以相邻内标线的波长中点为界,把采集的光谱分成m个光谱区域;对每个光谱区域,用该光谱区域内的内标线对光谱进行内标处理,即该光谱区域的所有光谱的强度分别除以该光谱区域内的内标线的强度,得到的比值作为内标后的光谱变量;第3步、对所有光谱变量进行权重标定:用所有光谱变量作为输入量,以选定一定的决策树棵数(ntree),以一定步长逐步增加使用的特征变量数(mtry),建立随机森林回归模型,对标准样品进行去一交叉验证法(Leave-One-OutCross-Validation,简写为LOOCV)分析,直至交叉验证的均方根误差(root-mean-squareerrorofcross-validation,简写为RMSECV)最小;把每个光谱变量在所有特征变量数情况下取得的权重值求平均,得到每个光谱变量平均后的权重值,该平均后的权重值称为平均权重值;用这些平均权重值表示不同光谱变量的重要性,作为判断光谱变量优劣的依据;第4步、建立人工神经网络分析模型:以平均权重值作为选择光谱变量的标准,选取平均权重值大于设定值的光谱变量作为人工神经网络的输入值,并利用标准样品中被分析元素的已知含量,对人工神经网络进行训练,获得人工神经网络分析模型和被分析元素的最优光谱变量集S1的构成规则;第5步、使用LIBS系统采集被测物的光谱,对于被测物的每幅光谱进行如下操作:当m等于1时,用这一条内标线对所有光谱进行内标处理,即所有光谱的强度分别除以这一条内标线的强度,得到的比值作为内标后的光谱变量;当m大于1时,以相邻内标线的波长中点为界,把采集的光谱分成m个光谱区域;对每个光谱区域,用该光谱区域内的内标线对光谱进行内标处理,即该光谱区域的所有光谱的强度分别除以该光谱区域内的内标线的强度,得到的比值作为内标后的光谱变量;按照被分析元素的最优光谱变量集S1的构成规则构建被测物中被分析元素的光谱变量集S2;第6步、将被测物中被分析元素的光谱变量集S2中的光谱变量作为输入值代入训练好的人工神经网络分析模型,输出被测物中被分析元素的含量。第4步的具体过程如下:第4.1步、计算光谱变量选择阈值QE:QE=QC-△Q,△Q=(QC-QD)/H,QC为所有光谱变量的平均权重值中的最大值,QD为所有光谱变量的平均权重值中的最小值,参数H为100~1000;第4.2步、选择平均权重值大于光谱变量选择阈值QE的光谱变量作为人工神经网络的输入值,并利用标准样品中被分析元素的已知含量,对人工神经网络进行训练,按照使用人工神经网络时对输入值和输出值进行归一化和反归一化操作的规则对人工神经网络的输入值和输出值进行归一化和反归一化操作;采用去一交叉验证法对n个标准样品中被分析元素含量进行预测,该预测重复l次,l为大于等于2的自然数;第4.3步、若l次预测结果一致,则执行第4.4步;若l次预测结果不一致,则按照人工神经网络参数选取的一般规律对人工神经网络参数选取不同的值,然后执行第4.2步;由于计算机执行时预测结果的数值并不会完全相等,只要在标准样品的被分析元素含量的有效数字精度范围内一致即可;第4.4步、计算交叉验证的均方根误差R1:其中:yi是第i个标准样品中被分析元素的已知含量,yij是第i个标准样品的第j幅光谱对应的预测值,每个标准样品采集的光谱幅数均为k;计算交叉验证的均方根误差R1时,从n个标准样品的分析结果中除去2个标准样品的分析结果,该2个标准样品为:被分析元素已知含量最大的标准样品和被分析元素已知含量最小的标准样品;将该次计算出的交叉验证的均方根误差R1和此时对应的光谱变量选择阈值QE记录下来;第4.5步、使光谱变量选择阈值QE=QE-ΔQ,然后判断光谱变量选择阈值QE是否大于ΔQ;如果QE大于ΔQ,执行第4.2步;如果QE不大于ΔQ,则根据每次测得的交叉验证的均方根误差R1和对应的光谱变量选择阈值QE做关系曲线,并找出关系曲线上交叉验证的均方根误差R1的最小值,该最小值对应的光谱变量选择阈值QE就是最优光谱变量选择阈值;第4.6步、选取平均权重值大于最优光谱变量选择阈值的光谱变量组成最优光谱变量集,光谱变量优化完成;把计算最小的交叉验证的均方根误差R1时所用的人工神经网络参数和训练参数作为分析模型参数和训练参数,并记录最优光谱变量集的构成规则,即最优光谱变量集里的光谱变量在光谱数据中的位置;第4.7步、使用最优光谱变量集作为输入值,并利用标准样品中被分析元素的已知含量,以第4.6步中选定的分析模型参数和训练参数对人工神经网络进行训练,得到训练好的人工神经网络分析模型。人工神经网络为MATLAB(Ver.:R2016a,MathWorksCorporation,USA)中的后向传播人工神经网络(Back-PropagatingArtificialNeuralNetwork,简写为BP-ANN)。第4.1步中,参数H为100或500或1000。第4.2步中,使用MATLAB中的归一化函数和反归一化函数对人工神经网络的输入值和输出值进行归一化和反归一化本文档来自技高网...

【技术保护点】
1.一种随机森林辅助人工神经网络的LIBS定量分析方法,其特征是:第1步、光谱数据的采集:选用n个和被测物基体构成一致的标准样品,n个标准样品中被分析元素含量已知且各不相同,使用LIBS系统对n个标准样品采集光谱数据;n为大于1的自然数;第2步、对光谱数据进行内标处理:按照内标法的标准找到一种内标元素的m条谱线作为内标线,m为大于等于1的自然数;对于每个标准样品的每幅光谱进行如下操作:当m等于1时,用这一条内标线对所有光谱进行内标处理,即所有光谱的强度分别除以这一条内标线的强度,得到的比值作为内标后的光谱变量;当m大于1时,以相邻内标线的波长中点为界,把采集的光谱分成m个光谱区域;对每个光谱区域,用该光谱区域内的内标线对光谱进行内标处理,即该光谱区域的所有光谱的强度分别除以该光谱区域内的内标线的强度,得到的比值作为内标后的光谱变量;第3步、对所有光谱变量进行权重标定:用所有光谱变量作为输入量,以选定决策树棵数,逐步增加使用的特征变量数,建立随机森林回归模型,对标准样品进行去一交叉验证法分析,直至交叉验证的均方根误差最小;把每个光谱变量在所有特征变量数情况下取得的权重值求平均,得到每个光谱变量平均后的权重值,该平均后的权重值称为平均权重值;第4步、建立人工神经网络分析模型:以平均权重值作为选择光谱变量的标准,选取平均权重值大于设定值的光谱变量作为人工神经网络的输入值,并利用标准样品中被分析元素的已知含量,对人工神经网络进行训练,获得人工神经网络分析模型和被分析元素的最优光谱变量集的构成规则;第5步、使用LIBS系统采集被测物的光谱,对于被测物的每幅光谱进行如下操作:当m等于1时,用这一条内标线对所有光谱进行内标处理,即所有光谱的强度分别除以这一条内标线的强度,得到的比值作为内标后的光谱变量;当m大于1时,以相邻内标线的波长中点为界,把采集的光谱分成m个光谱区域;对每个光谱区域,用该光谱区域内的内标线对光谱进行内标处理,即该光谱区域的所有光谱的强度分别除以该光谱区域内的内标线的强度,得到的比值作为内标后的光谱变量;按照被分析元素的最优光谱变量集的构成规则构建被测物中被分析元素的光谱变量集;第6步、将被测物中被分析元素的光谱变量集中的光谱变量作为输入值代入训练好的人工神经网络分析模型,输出被测物中被分析元素的含量。...

【技术特征摘要】
1.一种随机森林辅助人工神经网络的LIBS定量分析方法,其特征是:第1步、光谱数据的采集:选用n个和被测物基体构成一致的标准样品,n个标准样品中被分析元素含量已知且各不相同,使用LIBS系统对n个标准样品采集光谱数据;n为大于1的自然数;第2步、对光谱数据进行内标处理:按照内标法的标准找到一种内标元素的m条谱线作为内标线,m为大于等于1的自然数;对于每个标准样品的每幅光谱进行如下操作:当m等于1时,用这一条内标线对所有光谱进行内标处理,即所有光谱的强度分别除以这一条内标线的强度,得到的比值作为内标后的光谱变量;当m大于1时,以相邻内标线的波长中点为界,把采集的光谱分成m个光谱区域;对每个光谱区域,用该光谱区域内的内标线对光谱进行内标处理,即该光谱区域的所有光谱的强度分别除以该光谱区域内的内标线的强度,得到的比值作为内标后的光谱变量;第3步、对所有光谱变量进行权重标定:用所有光谱变量作为输入量,以选定决策树棵数,逐步增加使用的特征变量数,建立随机森林回归模型,对标准样品进行去一交叉验证法分析,直至交叉验证的均方根误差最小;把每个光谱变量在所有特征变量数情况下取得的权重值求平均,得到每个光谱变量平均后的权重值,该平均后的权重值称为平均权重值;第4步、建立人工神经网络分析模型:以平均权重值作为选择光谱变量的标准,选取平均权重值大于设定值的光谱变量作为人工神经网络的输入值,并利用标准样品中被分析元素的已知含量,对人工神经网络进行训练,获得人工神经网络分析模型和被分析元素的最优光谱变量集的构成规则;第5步、使用LIBS系统采集被测物的光谱,对于被测物的每幅光谱进行如下操作:当m等于1时,用这一条内标线对所有光谱进行内标处理,即所有光谱的强度分别除以这一条内标线的强度,得到的比值作为内标后的光谱变量;当m大于1时,以相邻内标线的波长中点为界,把采集的光谱分成m个光谱区域;对每个光谱区域,用该光谱区域内的内标线对光谱进行内标处理,即该光谱区域的所有光谱的强度分别除以该光谱区域内的内标线的强度,得到的比值作为内标后的光谱变量;按照被分析元素的最优光谱变量集的构成规则构建被测物中被分析元素的光谱变量集;第6步、将被测物中被分析元素的光谱变量集中的光谱变量作为输入值代入训练好的人工神经网络分析模型,输出被测物中被分析元素的含量。2.根据权利要求1所述的随机森林辅助人工神经网络的LIBS定量分析方法,其特征是:所述第4步的具体过程如下:第4.1步、计算光谱变量选择阈值QE:QE=QC-△Q,△Q=(QC-QD)/H,QC为所有光谱变量的平均权重值中的最大值,QD为所有光谱变量的平均权重值中的最小值,参数H为100~1000;第4.2步、选择平均权重值大于光谱变量选择阈值QE的光谱变量作为人工神经网络的输入值,并利用标准样品中被分析元素的已知含量,对人工神经网络进行训练,按照使用人工神经网络时对输入值和输出值进行归一化和反归一化操作的规则对人工神经网络的输入值和输出值进行归一化和反归一化操作;采用去一交叉验证法对n个标准样品中被分析元素含量进行预测,该预测重复l次,l为大于等于2的自然数;第4.3步、若l次预测结果一致,则执行第4.4步;若l次预测结果不一致,则按照人工神经网络参数选取的规律对人工神经网络参数选...

【专利技术属性】
技术研发人员:李阔湖代克杰赵志敏杜豪杰李鹏飞袁书卿
申请(专利权)人:平顶山学院
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1