一种用于复杂样品光谱的波长选择方法技术

技术编号:16325427 阅读:31 留言:0更新日期:2017-09-29 18:03
一种用于复杂样品光谱分析的波长选择方法,具体步骤为:采集样品光谱并确定组分含量;采用一定的分组方式,将数据集划分为训练集和预测集;然后将训练集的整个光谱范围划分为若干个子区间,用0/1表示是否选择某段波长;将萤火虫群体离散化;对萤火虫的初始化参数进行优化,得到优化参数;利用优化参数运行FA‑PLS算法,选择出对应复杂样品目标组分的波长点;对预测集中未知样品的含量进行预测。该方法的优势在于采用FA波长选择算法,运算速度快、提高了模型的预测精度。本发明专利技术适用于复杂样品光谱分析的波长选择领域。

【技术实现步骤摘要】
一种用于复杂样品光谱的波长选择方法
本专利技术属于分析化学领域的无损分析技术,具体涉及一种用于复杂样品光谱的波长选择方法。
技术介绍
复杂样品由于基体复杂、组分繁多而成为分析化学及工业生产中极具挑战性的问题。光谱分析技术因其操作简便、检验快速和不需要辅助试剂等优点,为复杂样品分析提供了一种有力手段,已广泛应用于农业、石化、制药、食品、烟草等领域。然而,由于复杂样品光谱谱带重叠严重,须借助多元校正技术才能对其组分进行定量分析。在光谱定量分析中,常用的多元校正方法有多元线性回归(MLR)、主成分回归(PCR)、偏最小二乘回归(PLS)、人工神经网络(ANN)、支持向量回归(SVR)等。传统多元校正是在全波段光谱与目标组分之间建立模型。随着现代分析仪器的发展,光谱数据往往由成百上千个波长点组成,并非所有波长点都与目标组分相关。因此,为了提高模型的预测效果,需要在多元校正前进行波长选择。美国Holland教授于1975年提出的遗传算法(GA),通过模拟自然选择和自然遗传过程中发生的繁殖、交叉和基因突变现象,不断迭代最终选取最优个体,成为一种应用最为广泛的波长选择方法。但该方法存在收敛速度缓慢、易陷入局部最优和对初始种群的选择要求较高等缺陷(Y.W.Lin,B.C.Deng,Q.S.Xu,Y.H.Yun,Y.Z.Liang,Theequivalenceofpartialleastsquaresandprincipalcomponentregressioninthesufficientdimensionreductionframework,Chemom.Intell.Lab.Syst.2016,150,58-64)。因此,需要发展快速、全局的智能优化方法。萤火虫算法(FA)由剑桥大学YangXin-she于2009年提出的一种智能优化算法。FA方法具有容易实现、计算效率高、无需严格的连续和可微条件等优势,在交通路径规划(刘厂,董静,高峰,李刚,张振兴,一种基于多目标萤火虫算法的路径规划方法,中国专利技术专利,2012,CN201210251782.7)、电力系统优化(王昕,郑益慧,李立学,胡博,含分布式发电设备的智能配电网供电优化方法,中国专利技术专利,2016,CN201610755691.5)和故障诊断(黄新波,宋桐,王娅娜,李文君子,基于灰模糊萤火虫算法优化的变压器故障诊断方法,中国专利技术专利,2013,CN201310647912.3)等方面已有应用,但很少有研究将FA用于复杂样品光谱波长选择中。
技术实现思路
本专利技术的目的是针对上述存在的问题,提出一种基于FA的波长选择方法(如图1),从而提高复杂样品定量分析的预测精度。为实现本专利技术所提供的技术方案包括以下步骤:1)收集一定数目的复杂样品作为分析对象,采集样品的光谱,并用常规分析方法测得每个样品中目标分析组分的含量。2)按照一定的分组方式,将数据集划分为训练集和预测集。3)将训练集的整个光谱范围划分为若干个子区间,萤火虫群体用0/1表示是否选择某段波长。4)利用公式(1)、(2)和(3)将萤火虫群体离散化。rij=xi-xj(2)其中,β0表示最大吸引力,γ表示环境吸光度,r表示萤火虫之间距离,t表示算法的迭代次数,α表示常数,εj表示高斯分布。5)依次优化因子数、波段数、种群数、环境吸光度和常数参数。因子数的优化方法为:因子数取值范围为1~25,间隔为1,计算不同因子数下的交叉验证均方根误差(RMSECV),通过蒙特卡罗交叉验证结合F检验确定PLS的最佳因子数。波段数的优化方法为:将整个光谱区间划分为5~30个波段数,间隔为5,分别计算不同波段数下的预测均方根误差(RMSEP)。最小的RMSEP值对应的波段数为最佳波段数。种群数的优化方法为:将种群数n划分为10~60个,间隔为10,计算不同种群数下的RMSEP值。最小的RMSEP值对应的种群数为最佳种群数。环境吸光度的优化方法为:环境吸光度γ取值范围为0.1~1.0,间隔为0.1,计算不同环境吸光度下的RMSEP值。最小的RMSEP值对应的吸光度为最佳环境吸光度。常数的优化方法为:常数α取值范围为0.1~1.0,间隔为0.1,计算在不同常数下的RMSEP值。最小的RMSEP值对应的常数为最佳常数。6)利用确定好的最佳参数,运行FA-PLS算法,选择出对应目标组分的波长点。7)对预测集中未知样品的含量进行预测。本专利技术的优点是:将萤火虫算法引入到复杂样品光谱定量分析中,算法收敛速度快,所选择的波长建立模型要优于全波段预测效果,为光谱波长选择提供了一种新方法,具有较高的实用价值。附图说明图1是FA算法流程图图2是小麦样品的可见-近红外光谱图图3是小麦数据的预测均方根误差随波段数的变化图图4是小麦数据的预测均方根误差随种群数n的变化图图5是小麦数据的预测均方根误差随环境吸光度γ的变化图图6是小麦数据的预测均方根误差随常数α变化图图7是血液样品的近红外光谱图图8是三元混合物样品的可见-近红外光谱图图9是燃油样品的近红外光谱图具体实施方式为更好理解本专利技术,下面结合实施例对本专利技术做进一步地详细说明,但是本专利技术要求保护的范围并不局限于实施例所表示的范围。实施例1:本实施例应用于可见-近红外光谱分析,对小麦样品中的蛋白质组分含量进行测定。具体的步骤如下:1)收集884个小麦样品作为分析对象,用6500型光谱仪(NIRsystems,Inc.,SilverSprings,USA)进行采集样品的光谱,波长范围为400-2498nm,采样间隔2nm,每个光谱包含1050个数据点,下载网址:http://www.idrc-chambersburg.org/shootout2008.html。图2显示了该实施例的近红外光谱图。2)按照网站上的分组方式,将777个样品作为训练集,107个样品作为预测集。3)将训练集的整个光谱范围划分为若干个子区间,萤火虫群体用0/1表示是否选择某段波长。4)利用公式(1)、(2)和(3)将萤火虫群体离散化。rij=xi-xj(2)其中,β0表示最大吸引力,γ表示环境吸光度,r表示萤火虫之间距离,t表示算法的迭代次数,α表示常数,εj表示高斯分布。5)依次优化因子数、波段数、种群数、环境吸光度和常数参数。因子数优化方法为:因子数取值范围为1~25,间隔为1,计算不同因子数下的交叉验证均方根误差(RMSECV),通过蒙特卡罗交叉验证结合F检验确定PLS的最佳因子数。本实施例的最佳因子数为10。波段数优化方法为:将整个光谱区间划分为5~30个波段数,间隔为5,分别计算不同波段数下的RMSEP。最小的RMSEP值对应的波段数为最佳波段数。图3显示了本实施例RMSEP随着波段数的变化。从图3中可以看出RMSEP值随着段数的增加先减小后增大,在10个波段取得最小RMSEP值。因此该实施例的最佳波段数为10。种群数的优化方法为:将种群数n划分为10~60个,间隔为10,计算不同种群数下的RMSEP值。最小的RMSEP值对应的种群数为最佳种群数。图4显示了本实施例RMSEP值随种群数的变化。从图4可以看出RMSEP随着种群数先下降后上升,在种群数为30处取得最小RMSEP值,由此确定该实施例的最佳种群数n为30。环境本文档来自技高网
...
一种用于复杂样品光谱的波长选择方法

【技术保护点】
一种用于复杂样品光谱分析的波长选择方法,其特征在于:1)收集一定数目的复杂样品作为分析对象,设置光谱仪器的参数,采集样品的光谱,并用常规分析方法测得每个样品中目标分析组分的含量;2)按照一定的分组方式,将数据集分为训练集和预测集;3)将训练集的整个光谱范围划分为若干个子区间,萤火虫群体用0/1表示是否选择某段波长;4)利用公式(1)、(2)和(3)将萤火虫离个体散化;

【技术特征摘要】
1.一种用于复杂样品光谱分析的波长选择方法,其特征在于:1)收集一定数目的复杂样品作为分析对象,设置光谱仪器的参数,采集样品的光谱,并用常规分析方法测得每个样品中目标分析组分的含量;2)按照一定的分组方式,将数据集分为训练集和预测集;3)将训练集的整个光谱范围划分为若干个子区间,萤火虫群体用0/1表示是否选择某段波长;4)利用公式(1)、(2)和(3)将萤火虫离个体散化;rij=xi-xj(2)其中,β0表示最大吸引力,γ表示环境吸光度,r表示萤火虫之间距离,t表示算法的迭代次数,α表示常数,εj表示高斯分布;5)依次优化因子数、波段数、种群数、环境吸光度和常数;6)利用确定好的最佳参数,运行FA-PLS算法,选择出对应目标组分的波长点;7)利用选择的波长点建立PLS模型,对预测集中未知样品的含量进行预测。2.根据权利要求1所述的复杂样品光谱分析的波长选择方法,其特征在于:FA-PLS算法的因子数的优化方法为:因子数从1变化到25,计算不...

【专利技术属性】
技术研发人员:卞希慧王必成第五鹏瑶谭小耀雷江南
申请(专利权)人:天津工业大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1