一种基于插值运算的光谱重构方法技术

技术编号:24574764 阅读:24 留言:0更新日期:2020-06-21 00:13
本发明专利技术涉及光谱重构技术领域,公开了一种基于插值运算的光谱重构方法。该方法首先选取有限数量含量已知纺织品作为样品,并采集每个样品的光谱数据,分为训练集和预测集,将训练集中样品的光谱数据结合其参比值进行偏最小二乘法建模,记录为模型A,然后根据样品参比值进行插值运算,计算虚拟插值点,再根据样品光谱数据以及虚拟插值点计算虚拟光谱数据,接着结合虚拟插值点与虚拟光谱数据对光谱模型A进行重构,获得重构模型B,最后,使用重构模型B对预测集样品进行预测,判断模型的预测效果。该方法可以有效扩充样品光谱数据库,解决光谱建模需要大量实体样品的问题。同时有着极高的重构效率,而且可以有效提升光谱模型的预测效果。

A spectral reconstruction method based on interpolation

【技术实现步骤摘要】
一种基于插值运算的光谱重构方法
本专利技术涉及光谱重构
,尤其涉及一种基于插值运算的光谱重构方法。
技术介绍
随着社会的发展,人们对生活品质的关注日益增加,尤其针对纺织品行业,各类纺织品和人们的生活密不可分,越来越多的消费者也愿意在纺织品上进行投入。但是随之而来的问题,部分不良商家利用消费者难以辨别纺织品品质,为了私利选择在相应的纺织品中掺假,损害了消费者的利益。然而随着光谱分析技术的发展,对纺织品品质的鉴定变得越发简单。光谱分析技术具有方便、快速、高效、准确和成本较低、不破坏样品、不消耗化学试剂、不污染环境等优点,在农业、食品、工业、纺织业等领域已有广泛的应用。纺织品光谱数据中包含丰富的物质信息,采用纺织品光谱数据以及相关化学值进行建模,能够快速实现对未知样品化学值的预测。但是随之而来的问题是,如若想获得效果良好的光谱模型,需要大量已知参比值的纺织品光谱数据进行数学建模,采集大量纺织品光谱数据不仅需要大量样品,而且采集过程费时费力,造成资源的浪费。因此,如何简单,快速获取纺织品光谱数据成为了需要解决的问题。
技术实现思路
根据以上现有技术中的不足,本专利技术要解决的技术问题是:提供一种基于插值运算的光谱重构方法,以解决现有技术中为了获得效果良好的光谱模型需要大量已知参比值的纺织品光谱数据进行数学建模,而采集大量纺织品光谱数据不仅需要大量样品,而且采集过程费时费力,造成资源的浪费的问题。为了解决上述问题,本专利技术采用的技术方案是:一种基于插值运算的光谱重构方法,包括如下步骤:步骤一:选取有限数量含量已知纺织品作为样品,并采集每个样品的光谱数据,分为训练集和预测集,将训练集中样品的光谱数据结合其参比值进行偏最小二乘法建模,记录为模型A;步骤二:根据样品参比值进行插值运算,计算虚拟插值点;步骤三:根据样品光谱数据以及虚拟插值点计算虚拟光谱数据;步骤四:结合虚拟插值点与虚拟光谱数据对光谱模型A进行重构,获得重构模型B;步骤五:使用重构模型B对预测集样品进行预测,判断预测集的预测参比值与实际参比值之间的相对误差是否超过设定的相对误差,没有超过设定相对误差则可以进行测量含量未知的样品,超过设定相对误差则增加训练集样品数量,重复步骤一至步骤五。作为进一步优化,步骤一中参比值选取样品的棉纤维含量,训练集的样品数量为两个以上,训练集样品数量大于等于预测集样品数量。作为进一步优化,步骤二中根据样品参比值进行插值运算,计算虚拟插值点。将样品参比值从小到大依次排列,在相邻两个样品参比值之间插入一个以上虚拟插值点,且虚拟插值点平均分布于相邻两个样品参比值之间,根据相邻两个样品参比值及虚拟插值点个数计算出各虚拟插值点数值。作为进一步优化,步骤三中根据样品光谱数据以及虚拟插值点计算虚拟光谱数据。在光谱运算中,样品的光谱数据由各个波长点的光强数据构成,计算虚拟光谱数据的过程实际为每个插值计算单位中最大参比值对应的各个波长点光强数据依次减去最小参比值对应各个波长点光强数据,再根据虚拟插值点个数进行等比例分配,分配完成后一一对应虚拟插值点。作为进一步优化,步骤四中结合虚拟插值点与虚拟光谱数据对光谱模型A进行重构,获得重构模型B。将虚拟光谱数据整合在原始光谱数据中,将虚拟插值点整合在原始参比值集合中,并使得光谱数据与参比值一一对应,然后使用偏最小二乘法算法对光谱模型A进行重新重构,得到重构模型B。作为进一步优化,步骤五中使用重构模型B对预测集样品进行预测,当预测集样品的预测参比值与实际参比值之间的相对误差是设定相对误差的两倍以上,则可以增加数倍的训练集样品数量,重复步骤一至步骤五;当预测集样品的预测参比值与实际参比值之间的相对误差是设定相对误差的一倍以上两倍以内,则可以增加小于一倍的训练集样品数量,重复步骤一至步骤五。本专利技术的有益效果是:通过一种基于插值运算的光谱重构方法,可以有效扩充样品光谱数据库,解决光谱建模需要大量实体样品的问题。同时,相较于已有的光谱重构方法,基于插值的重构方法不仅有着极高的重构效率,而且可以有效提升光谱模型的预测效果。附图说明图1为本专利技术公开的基于插值运算的光谱重构方法的流程图。具体实施方式下面结合实施例对本专利技术作进一步地详细说明,但本专利技术的实施方式不限于此。实施例1:参见图1,在步骤101中,选取有限数量含量已知纺织品作为样品,并采集每个样本的光谱数据,分为训练集和预测集,将训练集中样品的光谱数据结合其参比值进行偏最小二乘法建模,记录为模型A。选取20件纺织品作为样品集进行光谱数据的采集,其中10件纺织品作为训练集,其余10件纺织品作为预测集,建模算法为偏最小二乘算法,所述参比值可以选取为样品的棉纤维含量。在本实施例中,偏最小二乘法作为应用最为广泛的建模算法,其结合了多元线性回归(MLR)及主成分回归(PCR)法的优势,不仅能够对光谱矩阵进行处理,还能对棉纤维含量矩阵进行同样的处理,因此能够消除光谱矩阵以及棉纤维含量矩阵里的噪声信息,取得较好的预测效果。其计算过程为:对光谱矩阵及棉纤维含量矩阵进行分解,通过交互校验法确定其最佳主成分数,最后建立光谱矩阵与棉纤维含量矩阵的数学模型关系,该算法极度适用于棉纤维含量与光谱数据之间的建模。步骤102中,根据样品参比值进行插值运算,计算虚拟插值点。在本实施例中,10件纺织品的棉纤维含量从小到大依次设置为C1,C2……C10,在计算虚拟插值点时,选择两个临近棉纤维含量点进行运算,如若整体需要扩充90条光谱数据,即增加90个虚拟插值点,则C1~C2棉纤维含量中需要增加10个虚拟插值点,可以计算出在C1~C2棉纤维含量范围内的两个相邻插值点的数值差异ΔC为:ΔC=(C2-C1)/11进而可以计算出C1~C2棉纤维含量范围内10个虚拟插值点数值为(C1+ΔC,C1+2ΔC……C1+10ΔC),同理可得其余虚拟插值点的数值大小。步骤103中,根据样品光谱数据以及虚拟插值点计算虚拟光谱数据。在光谱运算中,样品的光谱数据由各个波长点的光强数据构成,计算虚拟光谱数据的过程实际为每个插值计算单位中最大棉纤维含量对应的各个波长点光强数据依次减去最小棉纤维含量对应各个波长点光强数据,再根据虚拟插值点个数进行等比例分配,分配完成后一一对应虚拟插值点。在本实施例中,本专利采用的近红外光谱仪波长范围为1150~1445nm,分辨率为6nm,总计为50个波长点。假定棉纤维含量为C1的样品光谱数据在50个波长点的光强值分别为M1,M2……M50,棉纤维含量为C2的样品光谱数据在50个波长点的光强值分别为N1,N2……N50,可以计算出当波长为1150nm时,棉纤维含量为C1与C2光强差值为:ΔK1=(N1-M1)/11进一步可以计算出,当波长为1150nm时,虚拟插值点数值为C1+ΔC的光强值为:P1=M1+ΔK1同理可以得出当波长为1150nm时,虚拟插值点数值为C1+2ΔC的光本文档来自技高网...

【技术保护点】
1.一种基于插值运算的光谱重构方法,其特征在于包括以下步骤:/n步骤一:选取有限数量含量已知纺织品作为样品,并采集每个样品的光谱数据,分为训练集和预测集,将训练集中样品的光谱数据结合其参比值进行偏最小二乘法建模,记录为模型A;/n步骤二:根据样品参比值进行插值运算,计算虚拟插值点;/n步骤三:根据样品光谱数据以及虚拟插值点计算虚拟光谱数据;/n步骤四:结合虚拟插值点与虚拟光谱数据对光谱模型A进行重构,获得重构模型B;/n步骤五:使用重构模型B对预测集进行预测,判断预测集样品的预测参比值与实际参比值之间的相对误差是否超过设定相对误差,没有超过设定相对误差则可以进行测量含量未知的样品,超过设定相对误差则增加训练集样品数量,重复步骤一至步骤五。/n

【技术特征摘要】
1.一种基于插值运算的光谱重构方法,其特征在于包括以下步骤:
步骤一:选取有限数量含量已知纺织品作为样品,并采集每个样品的光谱数据,分为训练集和预测集,将训练集中样品的光谱数据结合其参比值进行偏最小二乘法建模,记录为模型A;
步骤二:根据样品参比值进行插值运算,计算虚拟插值点;
步骤三:根据样品光谱数据以及虚拟插值点计算虚拟光谱数据;
步骤四:结合虚拟插值点与虚拟光谱数据对光谱模型A进行重构,获得重构模型B;
步骤五:使用重构模型B对预测集进行预测,判断预测集样品的预测参比值与实际参比值之间的相对误差是否超过设定相对误差,没有超过设定相对误差则可以进行测量含量未知的样品,超过设定相对误差则增加训练集样品数量,重复步骤一至步骤五。


2.如权利要求1所述的一种基于插值运算的光谱重构方法,其特征在于:步骤一中所述参比值选取样品的棉纤维含量,所述训练集的样品数量为两个以上,所述训练集样品数量大于或等于预测集样品数量。


3.如权利要求1所述的一种基于插值运算的光谱重构方法,其特征在于:步骤二中所述样品参比值从小到大依次排列,在相邻两个样品参比值之间插入一个以上虚拟插值点,且所述虚拟插值点平均分布于相邻两...

【专利技术属性】
技术研发人员:刘浩闫晓剑赵浩宇张国宏
申请(专利权)人:四川长虹电器股份有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1