一种化学指标检测模型的维护方法和装置制造方法及图纸

技术编号:32126416 阅读:17 留言:0更新日期:2022-01-29 19:15
本发明专利技术公开了一种化学指标检测模型的维护方法和装置,通过计算两个样本的近红外光谱的最大相似度,来筛选最邻近相似度,然后计算最近邻样本相似度与预测误差的相关关系,通过该相关关系给出接近度的预警阈值,对任一新样本,其光谱与建模集各样本光谱进行相似度度量,若最相似样本的相似程度小于预警阈值,则对该样本报警,说明其预测结果存在风险,并在相应的分析化学检测值出具后,将该样本补充到建模集中,完成模型维护,这样能够时刻进行模型的维护,以提升模型的检测准确性。以提升模型的检测准确性。以提升模型的检测准确性。

【技术实现步骤摘要】
一种化学指标检测模型的维护方法和装置


[0001]本专利技术属于化学计量学领域,具体涉及一种化学指标检测模型的维护方法和装置。

技术介绍

[0002]在化学计量学领域,通常使用光谱分析技术,包括近红外光谱、中红外光谱、紫外可见光谱、拉曼光谱等,对待测物感兴趣物质的含量进行建模。一般而言,以待测物光谱为X,以分析化学方法测得待测物感兴趣物质的含量,通过偏最小二乘(Partial Least Squares,PLS)等算法建立光谱与物质含量间的关联,得到预测模型。对未知含量的同类待测物,通过测量其光谱,通过预测模型即可得出该样本感兴趣物质的含量。
[0003]由于该类方法通过建模和预测达到原分析方法的效果,属于一种二次方法。对于未知样本预测结果的优劣,必须通过额外的分析方法检测才能确定。如果发现模型预测结果与分析化学检测结果有背离,则补充一定数量的新样本,还可能同时剔除同等数量时间最久的建模样本,对模型进行更新。在实际中,分析化学检测的效率较低,往往需要几天的时间,因此会导致模型更新的滞后,甚至由于检测结果的不准确蒙受经济损失。
[0004]目前,仅有主成分分析(PCA)等方法判断预测集光谱与训练集光谱是否一致,如不一致则认为预测集样本与建模集存在差异,无法预测,而如果通过PCA测试,则尚无方法对其预测结果进行评价。
[0005]公开号为CN112309512A的专利申请公开了一种用于卷烟配方维护的片烟化学宜用性评价方法,包括步骤:采集片烟样品,对所述片烟样品的化学指标进行检测;确定现用片烟化学指标的置信区间;建立片烟化学宜用性函数模型;确定欲替换的片烟样品的化学指标的宜用性得分;确定所述化学指标的权重;确定所述欲替换的片烟样品的化学宜用性评价值,根据所述欲替换的片烟样品的化学宜用性评价值确定其选用及调配顺序。该方法记载的片烟化学宜用性函数模型的维护仍然需要补充一定数量的新样本,还可能同时剔除同等数量时间最久的建模样本,对模型进行更新,检测效率低。
[0006]公开号为CN110085286A的专利申请公开了一种基于两步核最小二乘的卷烟配方维护方法,,包括:S1:数据处理,将配方数据转换成二进制配方矩阵,将单料烟组转换成二进制配方向量;S2:应用数据挖掘和TKRLS相关方法确定模型参数λu和λv,再根据模型参数λu和λv计算模型系数矩阵M;S3:根据模型系数矩阵M计算单料烟的预测值;S4:根据单料烟的预测值获得推荐的替换单料烟列表S;S5:根据单料烟列表S选择替换单料烟。该方法记载的模型的维护仍然需要补充一定数量的新样本,还可能同时剔除同等数量时间最久的建模样本,对模型进行更新,检测效率低。

技术实现思路

[0007]鉴于上述,本专利技术提供了一种化学指标检测模型的维护方法和装置,在利用模型进行化学指标检测的过程中,能够对模型预测效果进行判别,同时对模型进行维护,以提升
模型的检测准确性。
[0008]第一方面,实施例提供了一种化学指标检测模型的维护方法,包括以下步骤:
[0009](1)利用近红外光谱仪采集多个样本的近红外光谱作为样本集,采用分析化学方法检测每个样品的每种化学指标的检测值;
[0010](2)对样本集中每个近红外光谱进行预处理后,计算每个近红外光谱与样本集中其他近红外光谱的相似度,并记录每个近红外光谱的最大相似度值;
[0011](3)采用偏最小二乘对单项化学指标进行建模,得到化学指标检测模型和每个样本的单项化学指标的预测值,将该预测值与检测值之差作为建模误差;
[0012](4)以最大相似度值与建模误差组成的二元组对样本进行表征;
[0013](5)针对单项化学指标,以前N大的最大相似度值的样本作为集合,按照最大相似度值递减的方式向集合中增加样本,并计算集合中样本的建模误差均值,比较建模误差均值与下一次拟新增样本的建模误差,若两者的差异大于差异阈值,则停止向集合新增样本,并记录集合中最大相似度的最低值为预警阈值;
[0014](6)采集预测样本的近红外光谱预处理后,计算预测样本的近红外光谱与样本集中其他近红外光谱的最大相似度,若该最大相似度大于等于预警阈值,则利用步骤(3)建立的化学指标检测模型进行化学指标预测,若最大相似度小于预警阈值,则给出预警,将预测样本的化学指标的检测值补充到样本集,用于维护化学指标检测模型。
[0015]在一个实施例中,所述对样本集中每个近红外光谱进行预处理,包括:
[0016]对近红外光谱进行一阶导处理,然后将一阶导处理后的近红外光谱平均分段得到多个谱段,对每个谱段内的波数点进行校正。
[0017]在一个实施例中,所述对每个谱段内的波数点进行校正,包括:
[0018]针对每个谱段,计算每个谱段内所有波数点的均值mean(x)和标准差std(x),然后利用均值mean(x)和标准差std(x)按照以下公式进行校正:
[0019][0020]其中,x
i
表示谱段内第i个波数点的原始值,表示谱段内第i个波数点的校正值。
[0021]在一个实施例中,采用以下公式计算近红外光谱与样本集中其他近红外光谱的相似度:
[0022]s=

log
10
((1

p)*d)
[0023]其中,s表示相似度,p表示皮尔逊相关系数,计算公式为p=corr(y0,yj),y0表示目标谱,yj表示第j个近红外光谱,d表示目标谱y0与近红外光谱yj之间的欧式距离。
[0024]在一个实施例中,采用偏最小二乘对单项化学指标进行建模时,以近红外光谱为自变量,以单项化学指标为因变量,进行建模,拟合近红外光谱与单项化学指标之间的拟合参数,利用拟合得到的拟合参数预测每个样本的单项化学指标的预测值。
[0025]在一个实施例中,步骤(3)中,采用偏最小二乘对单项化学指标进行建模时,采用5折交叉验证,根据交叉验证误差选定模型的潜变量数。
[0026]在一个实施例中,步骤(5)中,以前N大的最大相似度值的样本作为集合时,N的取值范围为5

10。
[0027]在一个实施例中,步骤(5)中,差异阈值的计算方法为:t=mean(c)+k*std(c),其中,c为集合中样本的建模误差的绝对值,mean代表求平均,std代表求标准差,k为大于0的实数,优选设置为2或3。
[0028]第二方面,实施例提供了一种化学指标检测模型的维护装置,包括:
[0029]采集模块,用于利用近红外光谱仪采集多个样本的近红外光谱作为样本集,采用分析化学方法检测每个样品的每种化学指标的检测值;
[0030]相似度计算模块,用于对样本集中每个近红外光谱进行预处理后,计算每个近红外光谱与样本集中其他近红外光谱的相似度,并记录每个近红外光谱的最大相似度值;
[0031]建模模块,用于采用偏最小二乘对单项化学指标进行建模,得到化学指标检测模型和每个样本的单项化学指标的预测本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种化学指标检测模型的维护方法,其特征在于,包括以下步骤:(1)利用近红外光谱仪采集多个样本的近红外光谱作为样本集,采用分析化学方法检测每个样品的每种化学指标的检测值;(2)对样本集中每个近红外光谱进行预处理后,计算每个近红外光谱与样本集中其他近红外光谱的相似度,并记录每个近红外光谱的最大相似度值;(3)采用偏最小二乘对单项化学指标进行建模,得到化学指标检测模型和每个样本的单项化学指标的预测值,将该预测值与检测值之差作为建模误差;(4)以最大相似度值与建模误差组成的二元组对样本进行表征;(5)针对单项化学指标,以前N大的最大相似度值的样本作为集合,按照最大相似度值递减的方式向集合中增加样本,并计算集合中样本的建模误差均值,比较建模误差均值与下一次拟新增样本的建模误差,若两者的差异大于差异阈值,则停止向集合新增样本,并记录集合中最大相似度的最低值为预警阈值;(6)采集预测样本的近红外光谱预处理后,计算预测样本的近红外光谱与样本集中其他近红外光谱的最大相似度,若该最大相似度大于等于预警阈值,则利用步骤(3)建立的化学指标检测模型进行化学指标预测,若最大相似度小于预警阈值,则给出预警,将预测样本的化学指标的检测值补充到样本集,用于维护化学指标检测模型。2.根据权利要求1所述的化学指标检测模型的维护方法,其特征在于,所述对样本集中每个近红外光谱进行预处理,包括:对近红外光谱进行一阶导处理,然后将一阶导处理后的近红外光谱平均分段得到多个谱段,对每个谱段内的波数点进行校正。3.根据权利要求2所述的化学指标检测模型的维护方法,其特征在于,所述对每个谱段内的波数点进行校正,包括:针对每个谱段,计算每个谱段内所有波数点的均值mean(x)和标准差std(x),然后利用均值mean(x)和标准差std(x)按照以下公式进行校正:其中,x
i
表示谱段内第i个波数点的原始值,表示谱段内第i个波数点的校正值。4.根据权利要求1所述的化学指标检测模型的维护方法,其特征在于,采用以下公式计算近红外光谱与样本集中其他近红外光谱的相似度:s=

log
10
((1

p)*d)其中,s表示相似度,p表示皮尔逊相关系数,计算公式为p=corr(y0,yj),y0表示目标谱,yj表示第j个近红外光谱,d表示目标谱y0与近...

【专利技术属性】
技术研发人员:毕一鸣吴继忠郝贤伟田雨农戚奇杰廖付钟永健张兆鹏葛川吴灵通王筑临王辉郑宏斌李海峰夏骏童神刘建国李石头赵振杰
申请(专利权)人:浙江中烟工业有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1