本发明专利技术公开了一种光谱分析中样品集划分的化学计量学方法。计算参考化学值和每一个波长上的光谱吸光度的相关系数,在全谱范围内找到相关最高的波长点;分别对样品的参考化学值和光谱数据进行归一化处理;基于归一化处理的数据,设计把参考化学值最大和最小的2个样品,以及吸光度值最大和最小的2个样品放入定标集,并把相应次大次小值的4个样品放入预测集;对剩余的样品做充分多次的随机划分,基于最高相关波长点,对每一次划分分别计算定标集和预测集样品的化学值和吸光度的相关系数,如果某一个划分的定标集相关系数和预测集相关系数充分接近,则选择这个划分用来建立光谱分析模型。本发明专利技术为光谱分析的模型优化提供了良好的数据基础。
【技术实现步骤摘要】
本专利技术涉及光谱分析中的样品集划分
,具体涉及一种用于定标集和预测集划分的化学计量学方法。
技术介绍
光谱分析是根据物质的光谱通过定性或者定量分析来确定物质的化学成分及其含量的方法,由于其具有快速、灵敏、无创的优点。目前应用的光谱分析主要有红外光谱分析、紫外光谱分析、拉曼光谱分析等。特别是近红外(NIR)光谱分析技术以其简便快速、非破坏性、实时在线、多成分同时检测等特点在环境、食品、农业、生物医学等众多领域具有应用优势。光谱分析需要把全部待分析样品划分为定标集和预测集。首先利用定标集样品的 参考化学值(C)和光谱吸光度(A)来建立定标模型;然后结合预测集样品的光谱吸光度,利用定标模型计算预测集样品的成分含量预测值,通过比较预测集样品的预测值和参考化学值来评价模型的预测效果。定标模型是基于样品的光谱吸光度和参考化学值的数据来建立、优化和评价的。然而,在光谱测量过程中,由于实验环境、操作技能、仪器精度等原因,光谱吸光度有可能产生漂移、倾斜等各方面的噪音;同样的,在化学值测量方面,常规的化学测量方法也不可避免地带来系统噪音、环境噪音、操作噪音等,使得数据存在测量误差,导致所建立的定标模型很难得到理想的预测效果。实验表明,由于各种噪音的存在,定标集和预测集的不同划分会造成模型预测效果的变化很大,模型参数(如光谱分析波段、平滑模式、PLS因子数等)也会受到影响。为了找到一个良好的划分,提高模型的适用率,在定标集和预测集划分的过程中,考虑如何选取信噪比较高的波长点,以此为基点做出定标集和预测集良好的划分,是光谱分析的一个关键研究课题。
技术实现思路
本专利技术所要解决的技术问题是为光谱分析提供一种样品划分的化学计量学方法,采用该方法能够为光谱分析的模型优化做出良好的数据准备。该方法适用于紫外可见(UV)、近红外(NIR)、中红外(MIR)、拉曼(Raman)等光谱分析领域,已经在柚子皮果胶的NIR分析、土壤有机质总氮的NIR分析、废水化学需氧量的MIR分析、血液血红蛋白的MIR分析中得到验证。具体步骤为I)数据归一化a)参考化学值的归一化权利要求1.,其特征在于具体步骤为 1)数据归一化 a)参考化学值的归一化全文摘要本专利技术公开了。计算参考化学值和每一个波长上的光谱吸光度的相关系数,在全谱范围内找到相关最高的波长点;分别对样品的参考化学值和光谱数据进行归一化处理;基于归一化处理的数据,设计把参考化学值最大和最小的2个样品,以及吸光度值最大和最小的2个样品放入定标集,并把相应次大次小值的4个样品放入预测集;对剩余的样品做充分多次的随机划分,基于最高相关波长点,对每一次划分分别计算定标集和预测集样品的化学值和吸光度的相关系数,如果某一个划分的定标集相关系数和预测集相关系数充分接近,则选择这个划分用来建立光谱分析模型。本专利技术为光谱分析的模型优化提供了良好的数据基础。文档编号G01N21/33GK102854151SQ20121037506公开日2013年1月2日 申请日期2012年10月6日 优先权日2012年10月6日专利技术者陈华舟 申请人:桂林理工大学本文档来自技高网...
【技术保护点】
一种光谱分析中样品集划分的化学计量学方法,其特征在于具体步骤为:1)数据归一化a)参考化学值的归一化Cm=1NΣj=1NCj,---(1)norm(Cj)=CjΣj=1N(Cj-C‾)2=ΔCn(j),j=1,2....N,???????????(2)b)光谱数据的归一化i=1,2....P,???????????(3)i=1,2....P,j=1,2….N,(4)|Aj|=Σi=1P(norm(Aij))2=ΔAn(j),j=1,2....N,???????????(5)其中,N为样品个数,P为波长点个数;Cj为样品j的参考化学值,Cm为所有样品的参考化学值均值,Cn(j)=norm(Cj)为该样品的参考化学值经过归一化计算之后的化学值数据;Aij为样品j在第i个波长的吸光度值,Ai,m为该样品在第i个波长处的吸光度平均值,norm(Aij)为该样品在第i个波长处的吸光度值经过归一化计算之后的吸光度值;An(j)=|Aj|为样品j的吸光度向量的模;基于上述参考化学值和吸光度的归一化计算,每个样品对应有一个Cn(j)和一个An(j);根据琅勃比尔定律,基于所有样品的Cn(j)和An(j)(j=1,2,...,N),回归计算每个样品的化学值预测值C’n(j),随后计算每个样品的归一化数据回归偏差,即RDND,进一步对所有样品计算RDND的平均值,即RDNDAve;RDND(j)=|C’n(j)?Cn(j)|,???????(6)2)最值和次值样品的划分为了定标预测模型能够具有保证良好的相关性,原则上需要把具有Cn(j)最大值和最小值的2个样品和具有An(j)最大值和最小值的2个样品放入定标集,把具有Cn(j)次大值和次小值的2个样品和具有An(j)次大值和次小值的2个样品 放入预测集;然而,这其中所选择的样品可能有若干个是相同的,需要做相应的选择处理;具体操作过程如下:把具有Cn(j)最大值和最小值的2个样品和具有An(j)最大值和最小值的2个样品作为最值集合,记为SZ;同时把具有Cn(j)次大值和次小值的2样品和具有An(j)次大值和次小值的2样品作为次值集合,记为SC;首先假设SZ和SC的内部样品均不相同,设定每个集合内部的样品个数为4,下面针对SZ和SC的交集进行讨论,以确定最值样品的划分;如果SZ∩SC为空集,即SZ和SC互相之间没有相同的样品,则SZ所有样品放入定标集,SC所有样品放入预测集;进一步记录SZ内部具有相同样品的个数s1和SC内部具有相同样品的个数s2,即s1,s2∈{0,1,2};如果SZ∩SC不为空集,则记录SZ∩SC内部样品的个数s3,s3=1,2,3,4,把SZ∩SC内部每一个样品的RDND分别与RDNDAve比较大小,如果某个样品的RDND>RDNDAve,则该样品选择放入定标集,否则将该样品选择放入预测集;然后,把SZ∩Cs(SC)内部所有样品放入定标集,把Cs(SZ)∩SC内部所有样品放入预测集,并分别记录SZ∩Cs(SC)内部和Cs(SZ)∩SC内部具有相同样品的个数s1和s2,即s1,s2∈{0,1,2};其中Cs是补集运算符;3)剩余样品的划分原则经过最值样品的划分以后,剩余样品个数为N?8+s1+s2+s3。关于剩余样品的划分,基于最高相关的原则,分别计算每一个波长点i的光谱数据和参考化学值的相关系数R(i),R(i)=Σj=1N(Cj-Cm)(Aij-Ai,m)Σj=1N(Cj-Cm)2Σj=1N(Aij-Ai,m)2,i=1,2….P,(7)从所有的波长点中找到最大的Rnote=max{R(i),i=1,2....P},并记录Rnote所在的波长点序号inote;对剩余的样品做足够多次的随意划分,对每一次划分,选取第inote个波长点处的光谱数据{Anote},结合样品的参考化学值,分别在定标集内和预测集内计算相关系数RCset和RPset;RCset=Σj=1L(CL(j)-CLm)(Anote,L(j)-Anote,Lm)Σj=1L(CL(j)-CLm)2Σj=1L(Anote,L(j)-Anote,Lm)2,---(8)RPset=Σj=1K(CK(j)-CKm)(Anote,K(j)-Anote,Km)Σj=1K(CK(j)-CKm)2Σj=1K(Anote,K(j)-Anote,Km)2,...
【技术特征摘要】
【专利技术属性】
技术研发人员:陈华舟,
申请(专利权)人:桂林理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。