基于仿射变化的近红外光谱多目标标定迁移方法技术

技术编号:27463934 阅读:30 留言:0更新日期:2021-03-02 17:25
本发明专利技术公开了基于仿射变化的近红外光谱多目标标定迁移方法,该发明专利技术创造性地寻求浓度之间的线性趋势,趋势通常反映为直线,并且可以通过最小二乘回归拟合,同时,在MLCTAI方法中,数据集必须包含多种物质的浓度值,因此,主仪器的预测值包含多个标签,由于从仪器缺少响应值,因此由主仪器构建的PLS2模型将应用于从仪器模型的建立,并计算伪预测值以构建从仪器线性模型,但是,从主仪器视角观察从仪器的数据时会出现偏差,偏差具体表现为从仪器模型相对于主仪器模型的角度和截距差异,仿射变换则是通过旋转和平移来校正两个仪器模型的偏差,并且最终获得校正的预测值。并且最终获得校正的预测值。并且最终获得校正的预测值。

【技术实现步骤摘要】
基于仿射变化的近红外光谱多目标标定迁移方法


[0001]本专利技术涉及机器学习领域
,具体为基于仿射变化的近红外光谱多目标标定迁移方法。

技术介绍

[0002]近红外光谱分析技术包括定性分析与定量分析。定性分析的目的是确定物质的构成,而定量分析则是为了确定物质的含量。不同种类的物质所含化学成分的不同,就会导致含氢基团倍频与合频振动频率不同。此现象体现在近红外光谱图上则是峰位、峰数及峰强的差异。并且样品的化学成分差异越大,图谱的特征性差异越大。我们便可以根据这一依据来区分组分区别较大的物质。但对于组分区别较小的物质,只有通过定量分析来确定其组分及其含量。定量分析在没有复杂样本制备过程的条件下,能够在很短的时间内完成物质成分多组分的同步快速分析,并且有很高的分析精度,还不会有化学污染。
[0003]迁移学习是一种机器学习的方法,指的是一个事先训练的模型被重新用在另一个任务中。迁移学习在化学计量学领域的应用就是标定迁移。标定迁移的兴起是由于近红外光谱的广泛应用,这也促进了多元标定技术的发展。但当现有的模型在新的环境下,或者在新的仪器上使用时,效果就会很差。但使用重新标定方法十分昂贵而且费时。在这样的环境下,标定迁移应运而生。标定迁移指在不同的仪器下或者不同的条件下对多元标定模型的迁移。现有的近红外光谱多目标标定迁移方法有正交信号校正法、多重散射校正法、分段直接标准化、斜率截距校正方法的等等,然而上述方法存在的一定缺陷,需要的样本维度太高,同时样本数量太少,并且数据集中,在这种存在多变量因素的情况下无法满足迁移学习中减少或消除主从仪器之间的差异。

技术实现思路

[0004]本专利技术解决的技术问题在于克服现有技术的误差大、适用范围小等缺陷,提供基于仿射变化的近红外光谱多目标标定迁移方法。所述基于仿射变化的近红外光谱多目标标定迁移方法具有误差小、适用范围广等特点。
[0005]为实现上述目的,本专利技术提供如下技术方案:基于仿射变化的近红外光谱多目标标定迁移方法,包括主仪器和从仪器,该方法包括以下步骤:
[0006]S1:首先,建立PLS2模型,通过主仪器光谱和响应值的标定集和建立PLS2模型,计算出回归系数B
m
,定义为 S2:从主仪器的角度观测从仪器;通过PLS2模型的回归系数B
m
计算出主仪器的预测值和从仪器的伪预测值:
[0007]S3:根据标定集组合构建出基本的仿射变换模型;
[0008]S4:之后,为了减少预测误差,必须对前面所得的数据进行归一化。归一化其实就
是将数据变换到[0,1]范围内,以此保持相同的尺度;
[0009]S5:归一化化处理之后的与构建线性模型
[0010]S6:通过上述公式得到了两条拟合直线,通过该公式进行计算:
[0011]S7:以此完成基本的仿射变换模型构建。
[0012]S8:校正伪预测值,通过公式和步骤3中提取数据的方式得到
[0013]S9:通过公式S9:通过公式和构建变换矩阵M与增广矩阵
[0014]S10:根据公式进行仿射变换,最终得到
[0015]S11:中的是校正之后的预测值。
[0016]优选的,步骤1中X
m
为主仪器的光谱,Y
m
为主仪器的光谱响应值,并且X
m
和Y
m
均为已知量。
[0017]优选的,步骤1中的E
m
表示PLS2模型的残差矩阵。
[0018]优选的,步骤2中与中属于标定集的部分与用于构建仿射变换模型,中属于测试集的部分则与中测试集部分进行比较来检验仿射变换的性能。
[0019]优选的,步骤3中需要从中提取出任意两列和
[0020]优选的,步骤4中对和的归一化公式为,
[0021][0022]优选的,步骤5中构建线性模型的方法采用最小二乘法。
[0023]优选的,步骤6中Δθ和Δb表示两条拟合直线之间的角度差异和截距差异。
[0024]优选的,步骤8中λ
i
和λ
j
表示伪预测值的缩放因子,为仿射变换的增广矩阵。
[0025]与现有技术相比,本专利技术的有益效果是:
[0026]本专利技术创造性地寻求浓度之间的线性趋势,趋势通常反映为直线,并且可以通过最小二乘回归拟合,同时,在MLCTAI方法中,数据集必须包含多种物质的浓度值,因此,主仪器的预测值包含多个标签,由于从仪器缺少响应值,因此由主仪器构建的PLS2模型将应用于从仪器模型的建立,并计算伪预测值以构建从仪器线性模型,但是,从主仪器视角观察从仪器的数据时会出现偏差,偏差具体表现为从仪器模型相对于主仪器模型的角度和截距差异,仿射变换则是通过旋转和平移来校正两个仪器模型的偏差,并且最终获得校正的预测值。
附图说明
[0027]图1为本专利技术流程图;
[0028]图2为本专利技术数据提取方法。
具体实施方式
[0029]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]请参阅图1-2,本专利技术提供一种技术方案:基于仿射变化的近红外光谱多目标标定迁移方法,包括主仪器和从仪器,该方法包括以下步骤:
[0031]S1:首先,建立PLS2模型,通过主仪器光谱和响应值的标定集和建立PLS2模型,计算出回归系数B
m
,定义为其中,X
m
为主仪器的光谱,Y
m
为主仪器的光谱响应值,并且X
m
和Y
m
均为已知量,E
m
表示PLS2模型的残差矩阵;
[0032]S2:从主仪器的角度观测从仪器;通过PLS2模型的回归系数B
m
计算出主仪器的预测值和从仪器的伪预测值:测值和从仪器的伪预测值:与中属于标定集的部分与用于构建仿射变换模型,中属于测试集的部分则与中测试集部分进行比较来检验仿射变换的性能;
[0033]S3:根据标定集组合构建出基本的仿射变换模型,根据图2所表示的方法从中提取出任意两列和
[0034]S4:之后,为了减少预测误差,必须对前面所得的数据进行归一化。归一化其实就是将数据变换到[0,1]范围内,以此保持相同的尺度,和的归一化公式为,
[0035][0036]S5:归一化化处理之后的与采用最小二乘法构建线性模型
[0037]S6:通过上述公式得到了两条拟合直线,通过该公式进行计算:Δθ和Δb表示两条拟合直线之间的角度差异和截距差异;
[0038]S7:以此完成基本的仿射变换模型构建;
[0039]S8:校正伪预测值,通过公式和步骤3中提取数据的方式得到
...

【技术保护点】

【技术特征摘要】
1.基于仿射变化的近红外光谱多目标标定迁移方法,包括主仪器和从仪器,其特征在于,该方法包括以下步骤:S1:首先,建立PLS2模型,通过主仪器光谱和响应值的标定集和建立PLS2模型,计算出回归系数B
m
,定义为S2:从主仪器的角度观测从仪器;通过PLS2模型的回归系数B
m
计算出主仪器的预测值和从仪器的伪预测值:S3:根据标定集组合构建出基本的仿射变换模型;S4:之后,为了减少预测误差,必须对前面所得的数据进行归一化。归一化其实就是将数据变换到[0,1]范围内,以此保持相同的尺度;S5:归一化化处理之后的与构建线性模型S6:通过上述公式得到了两条拟合直线,通过该公式进行计算:S6:通过上述公式得到了两条拟合直线,通过该公式进行计算:S7:以此完成基本的仿射变换模型构建;S8:校正伪预测值,通过公式和步骤3中提取数据的方式得到S9:通过公式S9:通过公式和构建变换矩阵M与增广矩阵S10:根据公式进行仿射变换,最终得到S11:中的是校正之后的预测值。
2.根据权利要求1所述的基于仿射变化的近红外光谱多目标标定迁移方法,其特征在于:步骤1中X
m
为主仪器的光谱,Y
m
为主仪器的光谱响应值,并且X...

【专利技术属性】
技术研发人员:赵煜辉高书礼王琼赋
申请(专利权)人:东北大学秦皇岛分校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1