The invention specifically relates to an oil quality prediction method based on spectral linear representation; the principal component analysis is carried out on the near infrared spectrum data of the correction set and the test sample, and the principal component space of the first k components in the score matrix obtained by the principal component analysis is extracted, and the detection and measurement based on the Euclidean distance in the main sub space are based on the Euclidean distance. The recent sample of N calibration concentrated oil samples, called adjacent samples, calculated the near infrared spectrum weights w of adjacent samples, weighted the property values of adjacent samples using the near-infrared spectral weight value W, that is, the prediction of the properties of the tested samples. The invention predicts the test samples through a linear combination of specific weights, and combines the advantages of the parametric model and the non parametric model.
【技术实现步骤摘要】
一种基于光谱线性表示的油品性质预测方法
本专利技术属于石油化工的油品性质检测领域,具体涉及一种基于光谱线性表示的油品性质预测方法。
技术介绍
传统油品评价方法可以提供详细的原油性质数据,但其操作复杂,时间长,很难满足油品加工过程中对油品性质分析实时性的要求。目前,基于近红外光谱的建模技术趋于成熟,这些方法包括多元线性回归、局部加权回归、偏最小二乘等,并广泛应用于油品的性质预测。尽管这些方法已经开始考虑利用局部建模的思想来处理实际问题中存在的非线性,但其线性参数模型的本质仍然限制了模型的预测性能,且其计算相对复杂,也有较多需要调节的参数。基于拓扑聚类等非参数的模型,如k近邻法,能够适用于非线性问题且计算、调参相对于参数模型更为简便。但这些方法并没有充分利用输入信息,对数据的处理过于简单,欠缺对输入数据精细的考虑,使得其难以处理较为精确的预测问题。近红外光谱建模问题具有较强的非线性,且其输入数据为油品的波数段近红外吸光度数据,蕴含了大量的信息,这对传统的参数模型和非参数模型提出了挑战。因此,亟待对基于拓扑学的方法进行改进。
技术实现思路
针对前述传统油品评价方法的缺陷而提出的一种基于光谱线性表示的油品性质预测方法,本专利技术基于邻近样本,通过将其进行具有特定权值的线性组合对测试样本进行预测,结合了参数模型和非参数模型的优势。为了实现上述专利技术目的,本专利技术采用了以下技术方案:一种基于光谱线性表示的油品性质预测方法,包括以下步骤:1)首先对校正集及测试样本的近红外光谱数据进行主成分分析,提取主成分分析得到的得分矩阵的前k个主成分建立主成分空间,并在主成分空间中基 ...
【技术保护点】
一种基于光谱线性表示的油品性质预测方法,其特征在于,包括以下步骤:1)首先对校正集及测试样本的近红外光谱数据进行主成分分析,提取主成分分析得到的得分矩阵的前k个主成分建立主成分空间,并在主成分空间中基于欧式距离寻找到与测试样本最近的n个校正集中的油品样本,称为邻近样本;2)计算邻近样本的近红外光谱权值w,所述w加权线性组合与测试样本的近红外光谱之差的二范数最小,且w加权线性组合与测试样本的近红外光谱的和值为1;3)利用近红外光谱权值w对邻近样本的性质值进行加权,即得到测试样本的性质值预测。
【技术特征摘要】
1.一种基于光谱线性表示的油品性质预测方法,其特征在于,包括以下步骤:1)首先对校正集及测试样本的近红外光谱数据进行主成分分析,提取主成分分析得到的得分矩阵的前k个主成分建立主成分空间,并在主成分空间中基于欧式距离寻找到与测试样本最近的n个校正集中的油品样本,称为邻近样本;2)计算邻近样本的近红外光谱权值w,所述w加权线性组合与测试样本的近红外光谱之差的二范数最小,且w加权线性组合与测试样本的近红外光谱的和值为1;3)利用近红外光谱权值w对邻近样本的性质值进行加权,即得到测试样本的性质值预测。2.根据权利要求1所述的一种基于光谱线性表示的油品性质预测方法,其特征在于,在对新的待测样本进行预测时,所述校正集由油品样本库中所有样本组成。3.根据权利要求1所述的一种基于光谱线性表示的油品性质预测方法,其特征在于,所述欧式距离di的表达公式如下:其中pi,j为校正集第i个油品样本近红外光谱数据在第j个主成分上的得分,p0,j为测试样本近红外光谱数据在第j个主成分上的得分,k为主成分数。4.根据权利要求3所述的一种基于光谱线性表示的油品性质预测方法,其特征在于,所述k通过主成分分析中方差累积贡献率达到指定值予以确定或选取k=2或k=3。5.根据权利要求1所述的一种基于光谱线性表示的油品性质预测方法,其特征在于,所述近红外光谱权值w通过解正则化优化问题得到:s.t.1Tw=1其中X为邻近样本近红外...
【专利技术属性】
技术研发人员:焦一平,费树岷,陈夕松,
申请(专利权)人:东南大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。