一种预测样品中成分含量的方法及装置制造方法及图纸

技术编号:35723880 阅读:14 留言:0更新日期:2022-11-26 18:21
本发明专利技术属于分析检测领域,具体涉及一种预测样品中成分含量的方法,包括根据样品的红外光谱准确预测样品温度,然后以预测温度为标签,自动分配或实时建立分类模型和具有交叉浓度段的分段定量模型,之后通过模型来预测样品中的成分含量。本发明专利技术还涉及一种预测样品中成分含量的装置。本发明专利技术方法降低了温度波动对模型分析精度的影响,避免了宽校正浓度范围给全局定量模型带来的预测准确度劣化的影响,增强了模型泛化能力,提高了预测结果的准确度和精度。度。度。

【技术实现步骤摘要】
一种预测样品中成分含量的方法及装置


[0001]本专利技术属于分析检测领域,具体涉及一种预测样品中成分含量的方法及装置。

技术介绍

[0002]光谱技术通过化学计量学算法建立光谱信号与待测成分的函数关系(即分析模型),然后通过样本的光谱信号并根据分析模型实时检测出样本的成分信息。检测过程无损、无化学试剂消耗、分析速度快,颇受食品、药品等行业的青睐。
[0003]随着硬件技术的进步,小型化、便携化已成为光谱仪器的主要发展趋势之一,但光谱仪器检测主要存在如下两方面问题:一方面,受整体架构的限制,光谱仪器还难以具备恒温功能,特别是利用光谱仪对整个生产过程(例如天然种植、天然发酵)开展品质监控过程中,室外现场检测环境的温度波动大,难以具备样本恒温条件,光谱检测温度的变化会引起基团之间作用力改变,从而引起谱峰位置、谱带宽度、基线漂移等变化,导致模型的预测精度降低;另一方面,为了满足便携化光谱仪器应用在野外等复杂场景的分析要求,所采用的模型需要较宽的校正浓度范围,即训练样本浓度范围应尽可能包含使用该模型的样本浓度,但过宽的浓度范围也易导致光谱与浓度出现非线性响应,使线性模型的预测精度降低。
[0004]目前,针对光谱仪器检测温度变化问题主要有两种解决方式:一是进行温度校正,消除温度对模型的影响;二是建立含不同温度水平的全局定量模型;但是,前一种方式需要复杂的算法进行温度校正,后一种方式的模型稳健性较差,并且,后一种方式的全局定量模型以建立一个全浓度范围的模型为主,未解决过宽的校正浓度范围导致的非线性响应不可避免带来的预测准确度劣化问题。
[0005]因此,目前亟需降低或消除温度波动及宽校正浓度对模型分析精度的负面影响,以增强模型的泛化能力,提升实际生产中光谱在线检测的应用价值和深度,进一步帮助企业提质增量。

技术实现思路

[0006]本专利技术目的之一在于提供一种预测样品中成分含量的方法及装置,其根据样品的红外光谱预测其检测环境温度,然后采用以样品的环境温度预测值作为标签的定性模型和定量模型来预测样品中的成分含量,降低了温度波动对模型分析精度的影响,同时避免了全局定量模型的宽校正浓度范围带来的预测准确度劣化问题,增强了模型的泛化能力。
[0007]为实现上述目的,本专利技术第一方面涉及一种预测样品中成分含量的方法,包括如下步骤:
[0008](1)获取多个样品在同一温度(例如30℃)下的红外光谱,计算各红外光谱的一阶导数光谱,将所有一阶导数光谱的共同交叉点对应的波长确定为目标低敏波长;其中,所有样品的成分含量不同;
[0009](2)获取单一样品在不同温度(例如26.5℃、27.5℃、28.5℃、29.5℃、31.5℃、32.5℃、33.5℃、34.5℃、36.5℃)下的红外光谱,计算各红外光谱的一阶导数光谱,获取各一阶
导数光谱上目标低敏波长对应的纵坐标值,根据纵坐标值及对应的温度值建立光谱测温方程;优选地,如果步骤(1)确定了多个目标低敏波长,则分别针对每个目标低敏波长按照前述操作建立方程,然后将方程评估参数最优的方程选作光谱测温方程并选择对应的目标低敏波长;
[0010](3)获取待测样品的红外光谱,计算红外光谱的一阶导数光谱,获取一阶导数光谱上所选择的目标低敏波长对应的纵坐标值,将该纵坐标值代入光谱测温方程中计算,预测出待测样品的温度T;
[0011](4)如果数据库存储有在温度T下样品中成分的定性模型和定量模型,则直接将待测样品的红外光谱代入定性模型和定量模型中以预测待测样品中的成分含量;
[0012]否则,获取数据库存储的温度T
±
s的样本集P,0.5℃≤s≤1.5℃(例如1℃),数据库存储有样本集P中每个样本的实测温度、成分含量及红外光谱,按照如下所示的公式计算样本集P中每个样本的投影关联距离,将投影关联距离大于t的样本筛除,t为2.5~10(例如t为5、5.5、6、6.5、7、7.5、8),保留剩余样本;然后根据剩余样本的成分含量及红外光谱建立定性模型和定量模型,之后,将待测样品的红外光谱代入定性模型和定量模型中计算,预测出待测样品的成分含量;
[0013][0014]其中,
[0015]i为按照样本获取顺序的编号;
[0016]PCD
i
为第i个样本的投影关联距离;
[0017]L
i
为第i个样本主成分得分与样本集得分均值的残差,所述第i个样本主成分得分是以第i个样本的红外光谱中不同波长吸光度作为列数据所构建的1
×
n阶矩阵经PCA降维后得到的矩阵,所述样本集得分均值是样本集中所有样本主成分得分的均值;
[0018]C为样本集得分均值的协方差矩阵的逆矩阵;
[0019]L
i
'为L
i
的转置矩阵;
[0020]PCs为参与计算的主成分数。
[0021]本专利技术第一方面的一些实施方式中,步骤(1)中的温度为实际应用场景中样品通常的温度波动范围的中位值。
[0022]本专利技术第一方面的一些实施方式中,步骤(1)中的温度高于步骤(2)中温度的最低值且低于步骤(2)中温度的最高值。
[0023]本专利技术第一方面的一些实施方式中,步骤(1)中的温度取步骤(2)所有温度的中位值或均值。
[0024]本专利技术第一方面的一些实施方式中,将建立的定性模型和定量模型以温度T作为标签存储在数据库中。
[0025]本专利技术第一方面的一些实施方式中,所述方法包括如下的一项或多项特征:
[0026]a.所述样品为食品样品或天然发酵样品,优选为调味品样品,更优选为酱油样品;
[0027]b.所述成分为样品所含的理化成分,优选为食品样品所含的主要成分或食品添加剂(优选食品防腐剂,例如苯甲酸);
[0028]c.所述定性模型为分类模型,优选地,所述分类模型中的分类数量为三种;
[0029]d.所述定量模型为具有交叉浓度段的分段定量模型,优选地,所述分段定量模型包括三个浓度段和两个交叉浓度段;
[0030]更优选地,每个交叉浓度段的跨度占样本集P的浓度总跨度的2%~18%;
[0031]更优选地,每个交叉浓度段对应的样本数量占样本集P的样本总数量的5%~10%;
[0032]e.步骤(1)和/或步骤(2)中,温度的选取范围为20℃~50℃;
[0033]f.步骤(2)中,根据所述纵坐标值及温度值通过机器学习算法建立方程,优选通过回归算法建立方程;
[0034]g.步骤(1)、步骤(2)和/或步骤(3)中,在计算一阶导数光谱之前,对红外光谱预处理;
[0035]h.步骤(4)中,预测前,将待测样品的红外光谱进行数学预处理;可选地,在建模前,将数据库样本的红外光谱进行同样的数学预处理。
[0036]本专利技术第一方面的一些实施方式中,样本集P的浓度总跨度为样本集P中所有样本的成分含量的总跨度。
[0037]本专利技术第一方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测样品中成分含量的方法,包括如下步骤:(1)获取多个样品在同一温度下的红外光谱,计算各红外光谱的一阶导数光谱,将所有一阶导数光谱的共同交叉点对应的波长确定为目标低敏波长;其中,所有样品的成分含量不同;(2)获取单一样品在不同温度下的红外光谱,计算各红外光谱的一阶导数光谱,获取各一阶导数光谱上目标低敏波长对应的纵坐标值,根据纵坐标值及对应的温度值建立光谱测温方程;优选地,如果步骤(1)确定了多个目标低敏波长,则分别针对每个目标低敏波长按照前述操作建立方程,然后将方程评估参数最优的方程选作光谱测温方程并选择对应的目标低敏波长;(3)获取待测样品的红外光谱,计算红外光谱的一阶导数光谱,获取一阶导数光谱上所选择的目标低敏波长对应的纵坐标值,将该纵坐标值代入光谱测温方程中计算,预测出待测样品的温度T;(4)如果数据库存储有温度T下样品中成分的定性模型和定量模型,则直接将待测样品的红外光谱代入定性模型和定量模型中以预测待测样品中的成分含量;否则,获取数据库存储的温度T
±
s的样本集P,0.5℃≤s≤1.5℃,数据库存储有样本集P中每个样本的实测温度、成分含量及红外光谱,按照如下所示的公式计算样本集P中每个样本的投影关联距离,将投影关联距离大于t的样本筛除,t为2.5~10,保留剩余样本;根据剩余样本的成分含量及红外光谱建立定性模型和定量模型,然后将待测样品的红外光谱代入定性模型和定量模型中计算,预测出待测样品的成分含量;其中,i为按照样本获取顺序的编号;PCD
i
为第i个样本的投影关联距离;L
i
为第i个样本主成分得分与样本集得分均值的残差,所述第i个样本主成分得分是以第i个样本的红外光谱中不同波长吸光度作为列数据所构建的1
×
n阶矩阵经PCA降维后得到的矩阵,所述样本集得分均值是样本集中所有样本主成分得分的均值;C为样本集得分均值的协方差矩阵的逆矩阵;L
i
'为L
i
的转置矩阵;PCs为参与计算的主成分数。2.根据权利要求1所述的方法,其中,步骤(1)中的温度高于步骤(2)中温度的最低值且低于步骤(2)中温度的最高值;优选地,步骤(1)中的温度取步骤(2)所有温度的中位值。3.根据权利要求1所述的方法,其中,将建立的定性模型和定量模型以温度T作为标签存储在数据库中。4.根据权利要求1至3中任一项所述的方法,其特征在于如下的一项或多项:a.所述样品为食品样品或天然发酵样品,优选为调味品样品,更优选为酱油样品;b.所述成分为样品所含的理化成分;c.所述定性模型为分类模型,优选地,所述分类模型中的分类数量为三种;
d.所述定量模型为具有交叉浓度段的分段定量模型,优选地,所述分段定量模型包括三个浓度段和两个交叉浓度段;更优选地,每个交叉浓度段的跨度占样本集P的浓度总跨度的2%~18%;更优选地,每个交叉浓度段对应的样本数量占样本集P的样本总数量的5%~10%;e.步骤(1)和/或步骤(2)中,温度的选取范围为20℃~50℃;f.步骤(2)中,根据所述纵坐标值及温度值通过机器学习算法建立方程,优选通过回归算法建立方程;g.步骤(1)、步骤(2)和/或步骤(3)中,在计算一阶导数光谱之前,对红外光谱预处理;h.步骤(4)中,预测前,将待测样品的红外光谱进行数学预处理。5.一种预测样品中成分含量的装置,包括目标低敏波长确定模块、光谱测温方程建立模块、温度预测模块、存储模块、模型构建模块和成分含量预测模块;其中,所述目标低敏波长确定模块,用于获取多个样品在同一温度下的红外光谱,计算各红外光谱的一阶导数光谱,将所有一阶导数光谱的共同交叉点对应的波长确定为目标低敏波长;其中,所有样品的成分含量不同;所述光谱测温方程建立模块,用于获取单一样品在不同温度下...

【专利技术属性】
技术研发人员:杨平魏康丽李贤信魏启烘李术丹
申请(专利权)人:佛山市海天调味食品股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1