The embodiment of the present invention discloses a spectral data analysis method and device. The method includes: establishing a sample database, screening the adjacent spectral group of the sample to be measured, reducing the dimension of the adjacent spectral group by the cumulative contribution rate of the principal component, determining the target adjacent spectral group according to the ratio of Mahalanobis distance, and selecting the target adjacent spectral group with the smallest relative prediction error as the training set sample. The sample is forecasted to determine whether the representative of the sample database is sufficient or not, and if not, the sample to be tested is added to the sample database. By using molecular spectroscopy technology to establish sample database, the optimal target adjacent Spectral Group is automatically selected from the sample database according to the spectral characteristics of the sample to be measured. The physical and chemical data of the sample to be measured are further predicted and the representativeness of the sample database is determined. The automation of spectral data analysis process and database updating is realized, the prediction accuracy is improved, and the manual establishment is avoided. The complex work of maintaining the model facilitates the popularization and application of molecular spectroscopy technology.
【技术实现步骤摘要】
一种光谱数据分析方法及装置
本专利技术实施例涉及数据分析
,具体涉及一种光谱数据分析方法及装置。
技术介绍
分子光谱分析技术是利用物质分子和电磁波发生作用,从而对物质进行定性或定量分析的技术。分子光谱分析技术具有方便、快速、高效、准确、环境友好以及成本较低等优点,已被广泛应用于农业、石化产业、临床诊断、环境检测等领域。该技术的应用也面临着一些严峻的挑战。由于分子光谱技术的检测结果是基于大量数据建立的多元校正模型进行预测,只有待测样本的特征或含量范围处于模型数据适用范围内才能保证预测的准确性。随着时间、地点、原料、环境等要素的变化,超出模型适用范围的样本会不断增多,需要持续不断地对原模型进行扩充更新,但光谱数据分析的工作需要相当专业的知识背景和经验,多数使用者都难以达到该条件,这成为推广应用分子光谱技术的主要瓶颈。
技术实现思路
由于现有方法存在上述问题,本专利技术实施例提出一种光谱数据分析方法及装置。第一方面,本专利技术实施例提出一种光谱数据分析方法,包括:根据各样本的分子光谱和理化参考值建立样本数据库,根据光谱距离建立待测样本与所述样本数据库中的若干个样本的邻近光谱组,并分别根据各邻近光谱组建立对应的矩阵;对各矩阵进行主成分分析,计算得到各矩阵每个主成分对应的得分以及贡献率,并根据累计贡献率阈值对各矩阵进行筛选,得到若干个目标矩阵;计算所述待测样本的光谱与所述若干个目标矩阵对应的邻近光谱组之间的马氏距离,根据各马氏距离计算得到拟合评价参数RRPE(RelatedRelativePredictionError,相关相对预测误差);选择RRPE最小的目标邻 ...
【技术保护点】
1.一种光谱数据分析方法,其特征在于,包括:根据各样本的分子光谱和理化参考值建立样本数据库,根据光谱距离建立待测样本与所述样本数据库中的若干个样本的邻近光谱组,并分别根据各邻近光谱组建立对应的矩阵;对各矩阵进行主成分分析,计算得到各矩阵每个主成分对应的得分以及贡献率,并根据累计贡献率阈值对各矩阵进行筛选,得到若干个目标矩阵;计算所述待测样本的光谱与所述若干个目标矩阵对应的邻近光谱组之间的马氏距离,根据马氏距离计算得到拟合评价参数相关相对预测误差RRPE;选择RRPE最小的目标邻近光谱组,根据所述目标邻近光谱组预测所述待测样本的理化数据,并根据所述目标邻近光谱组的RRPE确定所述样本数据库对所述待测样本的代表性是否充足;若判断获知所述样本数据库的代表性不充足,则将所述待测样本添加至所述样本数据库,完成数据库的自动更新。
【技术特征摘要】
1.一种光谱数据分析方法,其特征在于,包括:根据各样本的分子光谱和理化参考值建立样本数据库,根据光谱距离建立待测样本与所述样本数据库中的若干个样本的邻近光谱组,并分别根据各邻近光谱组建立对应的矩阵;对各矩阵进行主成分分析,计算得到各矩阵每个主成分对应的得分以及贡献率,并根据累计贡献率阈值对各矩阵进行筛选,得到若干个目标矩阵;计算所述待测样本的光谱与所述若干个目标矩阵对应的邻近光谱组之间的马氏距离,根据马氏距离计算得到拟合评价参数相关相对预测误差RRPE;选择RRPE最小的目标邻近光谱组,根据所述目标邻近光谱组预测所述待测样本的理化数据,并根据所述目标邻近光谱组的RRPE确定所述样本数据库对所述待测样本的代表性是否充足;若判断获知所述样本数据库的代表性不充足,则将所述待测样本添加至所述样本数据库,完成数据库的自动更新。2.根据权利要求1所述的方法,其特征在于,所述根据光谱距离建立待测样本与所述样本数据库中的若干个样本的邻近光谱组,并分别根据各邻近光谱组建立对应的矩阵,具体包括:根据K最近邻分类算法KNN计算出所述样本数据库的样本中与所述待测样本的光谱距离最近的i个光谱,组成邻近光谱组NSSi,计算出所述样本数据库的样本中与所述待测样本的光谱距离最近的(i+1)个光谱,组成邻近光谱组NSSi+1,以此类推,计算出所述样本数据库的样本中与所述待测样本的光谱距离最近的(i+n)个光谱,组成邻近光谱组NSSi+n,并根据NSSi、NSSi+1、……、NSSi+n分别建立对应的矩阵;其中,i为大于等于10的整数,n为正整数。3.根据权利要求1所述的方法,其特征在于,所述根据马氏距离计算得到拟合评价参数相关相对预测误差RRPE,具体包括:分别计算各邻近光谱组的马氏距离之比MDri:MDri=Max(Di,D10)/Min(Di,D10)其中,D10表示所述待测样本的光谱到NSS10的距离;筛选得到小于设定阈值的目标MDri,并对各目标MDri对应的邻近光谱组和所述待测样本进行拟合,得到拟合评价参数相关相对预测误差RRPE。4.根据权利要求1所述的方法,其特征在于,所述选择RRPE最小的目标邻近光谱组,根据所述目标邻近光谱组预测所述待测样本的理化数据,并根据所述目标邻近光谱组的RRPE确定所述样本数据库对所述待测样本的代表性是否充足,具体包括:选择RRPE最小的目标邻近光谱组为自变量,所述待测样本光谱为因变量进行回归拟合得到回归系数,并根据所述...
【专利技术属性】
技术研发人员:朱业伟,曹江娜,曾智朋,王征,王帅,
申请(专利权)人:北京格致同德科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。