当前位置: 首页 > 专利查询>广西工学院专利>正文

多变量体系中的纯信号分析方法技术

技术编号:6001562 阅读:272 留言:0更新日期:2012-04-11 18:40
一种多变量体系中的纯信号分析方法,涉及一种化学计量学、过程分析方法,该方法是采用数据空间来描述多变量体系,所述的数据空间M划分为由被关注变量的向量s张成的子空间S和由其余变量的向量张成的相邻子空间H,即M=SH;所述的数据空间M为多变量体系,被关注变量的子空间S即为多变量体系中被关注变量的纯信号,其余变量的相邻子空间H即为多变量体系中的其它信号;然后以已知的建模样本中被关注变量的向量s和其余变量的相邻子空间H互为核关系建立纯信号分离模型,通过该纯信号分离模型即可以从其它未知的数据空间M中将被关注变量的纯信号分离出来。本发明专利技术能实现从混合信号中求取、纯化被关注信号,非常适于在化学分析中使用。

【技术实现步骤摘要】

本专利技术涉及一种化学计量学、过程分析技术(Process Analytical Technology, 缩写为PAT)中多变量统计分析方法,具体为一种能实现从混合信号中求取、纯化被关注信 号,在多变量体系中,通过算法计算实现被测组分的信息分离的多变量体系中的纯信号分 析方法。
技术介绍
现实世界提供的信息通常都是来源于多个信息源的混合信息,在系统或体系的描 述中,称之为多组分(多变量)问题。在分析化学中,同时测定体系多组分或处理多路传感信 号也是经常遇到的问题。在解决多组分问题时,多变量(统计)分析方法发挥了重要作用。多变量分析方法目前主要采用回归校正方法,该方法可以分成CLS(claSSical least squares 的缩写)、ILS(inverse least squares 的缩写)、MLR(multiple linear regression的缩写)等直接回归方法,和PLS (partial least squares的缩写)、 PCR(principal component regression 的缩写)、RR(ridge regression 的缩写)、 TR(Tikhonov regularization 的缩写)等 SVD (singular-value decomposition 的缩写) 分解重构回归方法;SVD分解重构方法可以较大程度地解决直接回归中的条件数过大问 题,因而被较多采用。与回归方法思路不同的是净分析信号(Net analyte signal,缩写为 NAS)方法,该净分析信号(NAS)方法是利用体系中纯物质信息,例如光谱分析中纯组分的系 列吸光系数,完成多变量分析。基于回归校正方法是将已知自变量和因变量样本通过回归手段建立对应关系,其 中直接回归是通过已知的确定自变量与因变量回归,奇异值分解回归是将自变量数据正交 分解成可整体描述体系的隐含变量(latent variable)后,与因变量回归。基于样本回归 建立的模型随建模样本变化,对建模样本要求高,实际是回归插值方法,模型预测准确度由 建模样本与被预测值的近似程度决定,泛化性能差。同时需要大量的已知样本,提高了建模 成本和实施难度。净信号分析方法是通过被测变量的正交投影关系,将被测变量的纯信息从混合变 量中投影出来,可以更充分的利用体系的相关信息,减小了对已知样本的依赖。但是由于采 用的是正交投影,其结果存在偏差,是实际变量的有偏估计量,故而此方法多用于多变量分 析方法的误差估计,较少直接用于多变量分析建模。在实际分析任务中,通常只对体系中某种或某几种组分感兴趣,其纯物质性质通 过测定或查取资料可以较容易得到。例如,光谱分析中,被测物纯样的光谱可以通过直接测 定纯标准物或查取光谱数据库就能得到,这项工作在分析测试开始之前通常已经完成。但 是在各类回归建模方法中,这样重要的信息却未利用,必须通过测试被测物含量和混合体 系的响应,建立系列样本满足回归要求。因此,充分利用体系信息,降低建模的样本依赖,控制或消除模型的预测偏差,对 于化学计量学和过程分析技术具有十分重要的意义。
技术实现思路
本专利技术要解决的技术问题是提供一种,该方法 可通过所建的模型实现多变量体系中被关注变量的信息分离,完成定量及定性任务。解决上述技术问题的基本原理是在多变量体系中,多变量体系所含的各个实际 变量信息混合,加上噪声等不确定信号,构成多变量体系的信号输出。如果采用数据空间 描述,体系包含的η个实际变量被看做η个确定的不平行向量,η个向量张成实际变量子空 间,包含于噪声构成的无限维空间中,因此,多变量问题求解即是从多维空间中确定该实际 变量所对应向量的模量。由实际向量构成的子空间可以被其中任何一组不平行向量所描述。但是直接回归 经常遇到共线性问题,导致条件数过大而不可行,而正交分解重构可解决这一问题,特征值 分解(SVD分解)将测量数据分解成相互正交的基向量用来定义或描述向量空间,在分解重 构回归方法中这些向量被称为隐含变量,其实是实际向量分解于这些基向量上,并依据分 解定量关系的重构。目前的多变量空间描述方法基本上都衍生于SVD分解。分解得到的隐 藏变量不能直接反映实际变量的定量关系,必须采用实际测定值回归到实际变量完成定量 测定。净分析信号将被关注变量和其他变量的关系表达为向量和超平面关系,如附图说明图1所 示,在该图1中,sKnrt为净分析信号,&为总测量信号,在其他信号张成的子空间超 平面上的投影。但是,净分析信号采用向量和超平面的垂直投影关系,而实际变量之间很少 能满足垂直(正交)关系,因而净分析信号无法满足变量准确定量。本专利技术提出将数据空间M划分为“被关注变量”向量s张成的子空间S和“其余变量”的“相邻子空间” H,M=S H。依据空间中线性变换关系,那么在M中存在投影变换,使s和H互为核。即以s和H互为 核关系建立的模型可以通过系列正交投影实现,用以描述张量空间中的非正交关系。该模 型中的向量与其“相邻子空间”不必满足正交要求,可以准确、独立地描述向量在空间中的 实际存在,具有最好的描述准确度。基于核的相邻子空间投影变换表达为权利要求1.一种,其特征在于该方法是采用 数据空间来描述多变量体系,并将所述的数据空间M划分为由被关注变量 的向量s张成的子空间S和由其余变量的向量张成的相邻子空间H,即M=S ι H所述的数据空间M为多变量体系,被关注变量的子空间S即为多变量体系中被关注变 量的纯信号,其余变量的相邻子空间H即为多变量体系中的其它信号;然后以已知的建模 样本中被关注变量的向量s和其余变量的相邻子空间H互为核关系建立纯信号分离模型, 通过该纯信号分离模型即可以从其它未知的数据空间M中将被关注变量的纯信号分离出 来。2.根据权利要求1所述的,其特征在于所述的纯信 号分离模型即为斜投影算子,该算子的表达式为E_ = s(sTPHJ-s)~1sTPHi-,其中,pi = I^PH =I^H(HtH) ^1HT在上式中,上标T代表矩阵的转置,I为与1\维数相同的单位矩阵。3.根据权利要求1或2所述的,其特征在于该方法 包括建模和预测两大步骤I、建模通过已知的建模样本求取斜投影算子,该算子即为纯信号分析模型,具体内容包括Ml、输入确定的建模样本Mtl和被关注变量的单位向量^ 输入确定的建模样本的数据空间M0以及系列建模样本中被关注变量的单位向量% ;&2、判断数据空间M0中其他信号Htl是否已知判断建模样本的数据空间M0中不包含被关注变量的其他信号Htl是否已知,如果是,即 当已知的建模样本直接由直交样本构成时,也就是已知被关注变量的单位向量^和若干个 不包含被关注变量的其他信号Htl混合样本响应,则直接进入步骤Sa4 ;如果否,则进入步骤 Sa3 ;&ι3、求取其它信号H。Sa3. 1、输入确定的建模样本中被关注变量的含量Ctl ;Sa3. 2、求取被关注变量的子空间& 由于建模样本中的数据空间Mtl由被关注变量的子 空间&和其他信号Htl构成,因此要求取其它信号Htl,就首先求取系列建模样本中被关注变 量的子空间&,该被关注变量的子空间&即是被关注变量的单位本文档来自技高网
...

【技术保护点】
一种多变量体系中的纯信号分析方法,其特征在于:该方法是采用数据空间来描述多变量体系,并将所述的数据空间M划分为由被关注变量的向量s张成的子空间S和由其余变量的向量张成的相邻子空间H,即M=S*H;所述的数据空间M为多变量体系,被关注变量的子空间S即为多变量体系中被关注变量的纯信号,其余变量的相邻子空间H即为多变量体系中的其它信号;然后以已知的建模样本中被关注变量的向量s和其余变量的相邻子空间H互为核关系建立纯信号分离模型,通过该纯信号分离模型即可以从其它未知的数据空间M中将被关注变量的纯信号分离出来。

【技术特征摘要】

【专利技术属性】
技术研发人员:姚志湘粟晖
申请(专利权)人:广西工学院
类型:发明
国别省市:45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1