当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法技术

技术编号:16035720 阅读:28 留言:0更新日期:2017-08-19 16:43
本发明专利技术属于光谱分析领域,尤其是涉及一种基于CC‑PLS‑RBFNN优化模型的近红外光谱分析方法。所述方法结合了相关系数法(CC)、偏最小二乘法(PLS)与径向基函数神经网络(RBFNN),并对重要参数进行了优化;包括:利用三阶Savitzky‑Golay卷积平滑滤波及一阶导数校正对原始光谱进行预处理;在全波长段建立PLS模型并优化选取窗口宽度和PLS提取的主成分个数;计算每个波长变量的相关系数,截取相关系数大于设定阈值的波长变量参与建模并优化选取阈值大小;利用优化选取的窗口宽度、主成分个数和波长变量得到优化PLS模型;用优化PLS模型提取的主成分得分和性质矩阵训练RBF神经网络,获得最终的CC‑PLS‑RBFNN优化模型。本方法能显著提高近红外光谱分析的鲁棒性与精度。

【技术实现步骤摘要】
一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法
本专利技术涉及近红外光谱分析领域,尤其是涉及一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法。
技术介绍
近红外光谱分析技术作为一种快速无损的定量分析方法,已成功应用于农业、食品、化工和生物科学等多个领域,创造了可观的经济、社会效益。近红外光谱中包含了丰富的样品基团信息,然而近红外谱区内光谱吸收带较宽并且存在严重的光谱重叠,对此通常引入统计学方法建立合适的多元校正模型,从而实现光谱数据与预测目标数据间的关联。目前,关于近红外光谱分析中校正模型的研究,典型的线性建模方法有多元线性回归、主成分回归以及偏最小二乘法等,非线性校正方法主要包含支持向量机和神经网络。多元线性回归的局限性在于,建模过程中包含对光谱矩阵或样本性质矩阵求逆的步骤,该步骤在矩阵奇异时无法完成,同时多元线性回归模型自身不具备去除数据噪声的能力;主成分回归通过对光谱矩阵或样本性质矩阵进行分解从而确保矩阵非奇异,但进行分解时未考虑到光谱数据和样本性质数据间的关联性,因此不适用于分析目标信息在光谱信息中含量微弱的情况;偏最小二乘法在主成分回归的基础上考虑了光谱数据和样本性质数据的相关性,但作为一种线性校正方法,其建立的模型始终存在一定的非线性误差;基于支持向量机的回归模型有较好的非线性拟合能力,但在建模过程中借助二次规划来求解支持向量,涉及样本数量阶次的矩阵计算,在样本数量偏大时耗费大量的机器内存和计算时间;神经网络模型可以映射任意复杂的非线性关系,并且学习规则简单便于计算机实现,但对数据的充分性有很高的要求,当数据量不足时容易过拟合,降低模型鲁棒性,上述现有方法的局限性,影响了模型的鲁棒性和精度。
技术实现思路
本专利技术的目的在于,针对现有技术的不足,提出将相关系数法(correlationcoefficientmethod,简称CC)、偏最小二乘法(PartialLeastSquares,简称PLS)、径向基函数神经网络(RadialBasisFunctionNeuralNetwork,简称RBFNN)相结合并优化选取重要参数,提供一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,以提升近红外光谱建模的鲁棒性和精度。为此,本专利技术采用如下解决方案:一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,所述基于CC-PLS-RBFNN优化模型的近红外光谱分析方法包括:利用三阶Savitzky-Golay卷积平滑滤波及一阶导数校正对原始光谱进行预处理;在全波长段建立PLS模型并优化选取平滑滤波的窗口宽度和PLS提取的主成分个数;计算每个波长变量的相关系数,截取相关系数大于设定阈值的波长变量参与建模并优化选取阈值大小;利用优化选取的窗口宽度、主成分个数和波长变量得到优化PLS模型;用优化PLS模型提取的主成分得分和性质矩阵训练RBF神经网络,获得最终的CC-PLS-RBFNN优化模型;具体步骤包括:步骤(1):参数初始化:将样本划分为校正集和预测集;校正集的光谱矩阵为Xs(s×p),具有s个样本,全波长点有p个,校正集的样本性质矩阵为Ys(s×1);预测集的光谱矩阵为Xt(t×p),具有t个样本,全波长点有p个,预测集的样本性质矩阵为Yt(t×1);定义n为平滑滤波的窗口宽度,q为主成分个数,TH为相关系数阈值;设定最大窗口宽度n_MAX,最大主成分个数q_MAX,相关系数阈值遍历间隔d_TH,最大相关系数阈值TH_MAX,以及设定RBF神经网络核函数扩展因子σ,网络神经元数量m;窗口宽度n初始化为5,主成分个数q初始化为5,相关系数阈值TH初始化为0;步骤(2):光谱预处理:对校正集原始光谱矩阵Xs(s×p)逐行进行n点三阶Savitzky-Golay卷积平滑滤波,并进行一阶求导完成光谱预处理,得到校正集预处理后光谱矩阵Xs’(s×p);步骤(3):PLS初始建模:对预处理后的s个校正集的样本利用PLS模型提取q个主成分,对预处理后光谱矩阵Xs’(s×p)及对应的样本性质矩阵Ys(s×1)进行回归建模并得到全波长PLS模型,并采取留一交叉验证的方法,得到相应的RMSECV值;步骤(4):选择模型参数:依次遍历不同的n和q,重复步骤(2)到步骤(3),直至n=n_MAX,q=q_MAX,得到不同模型参数下的RMSECV值;n和q的遍历间隔分别为2和1,选取使得RMSECV最小的n和q作为优化选取下的模型参数;步骤(5):筛选光谱矩阵:对校正集预处理后光谱矩阵Xs’(s×p)及对应样本性质矩阵Ys(s×1)展开相关分析,得到p个波长变量的相关系数,构成相关系数矩阵C(1×p);设相关系数大于设定的相关系数阈值TH的波长变量共有p’个,选取这部分波长变量对应的预处理后光谱矩阵Xs’(s×p)的子集,构成筛选后光谱矩阵Xs_selected(s×p’);步骤(6):部分波长PLS建模:在步骤(4)优化选取的模型参数下,对筛选后光谱矩阵Xs_selected(s×p’)及对应样本性质矩阵Ys(s×1)进行预处理和PLS回归建模,得到部分波长下的PLS模型,并采取留一交叉验证的方法,得到相应的RMSECV值;步骤(7):选择相关系数阈值TH:以d_TH为相关系数阈值遍历间隔,依次遍历不同的TH,重复步骤(5)至步骤(6),直至TH=TH_MAX,得到不同的RMSECV值;选取使得RMSECV最小的TH作为优化选取的相关系数阈值,建立部分波长下的优化PLS模型;步骤(8):训练RBF神经网络:将步骤(7)所得的优化模型所提取的主成分得分矩阵Score(s×q)作为输入变量,对应的样本性质矩阵Ys(s×1)作为目标变量,进行RBF神经网络的训练,得到最终的CC-PLS-RBFNN优化模型。在采用上述技术方案的同时,本专利技术还可以采用或者组合采用以下进一步的技术方案:所述步骤(4)中,所述最大窗口宽度n_MAX的取值范围优选15到45之间。所述步骤(4)中,所述最大主成分个数q_MAX的取值范围优选10到50之间。所述步骤(7)中,所述相关系数阈值遍历间隔d_TH的取值范围优选0.001到0.1之间。所述步骤(7)中,所述最大相关系数阈值TH_MAX的取值范围优选0.4到0.6之间。所述步骤(8)中,所述步骤(8)中,所述RBF神经网络所用径向基函数为高斯核函数,形式为k(||x-xc||)=exp[-||x-xc||2/(2σ2)],式中xc是核函数中心;σ为扩展因子,优选为0.1至2之间;网络的神经元数量m优选s/3到s之间,其中s为训练网络的校正集样本数量。本专利技术所提供的近红外光谱分析方法具有以下优点:(1通过卷积平滑滤波和求导校正对原始光谱进行预处理,降低光谱中随机噪声对建模的不利影响;(2)采用相关系数法对光谱进行波长筛选,最大化甄别出有益波长参与建模;(3)通过PLS模型和RBFNN模型的结合,在保留PLS提取光谱有效信息能力的同时,利用RBFNN的任意非线性拟合能力,降低主成分得分的非线性回归残差,提升了模型精度;(4)采用留一交互验证,最优化选择建模过程中的关键参数从而优化所建模型,提升了模型的鲁棒性和精度。附图说明图1为本专利技术基于CC-PLS-RBFN本文档来自技高网
...
一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法

【技术保护点】
一种基于CC‑PLS‑RBFNN优化模型的近红外光谱分析方法,其特征在于,所述基于CC‑PLS‑RBFNN优化模型的近红外光谱分析方法包括:利用三阶Savitzky‑Golay卷积平滑滤波及一阶导数校正对原始光谱进行预处理;在全波长段建立PLS模型并优化选取平滑滤波的窗口宽度和PLS模型中提取的主成分个数;计算每个波长变量的相关系数,截取相关系数大于设定阈值的波长变量参与建模并优化选取阈值大小;利用优化选取的窗口宽度、主成分个数和波长变量得到优化PLS模型;用优化PLS模型提取的主成分得分矩阵和对应的样本性质矩阵训练RBF神经网络,获得最终的CC‑PLS‑RBFNN优化模型;具体步骤包括:步骤(1):参数初始化:将样本划分为校正集和预测集;校正集的光谱矩阵为Xs(s×p),具有s个样本,全波长点有p个,校正集的样本性质矩阵为Ys(s×1);预测集的光谱矩阵为Xt(t×p),具有t个样本,全波长点有p个,预测集的样本性质矩阵为Yt(t×1);定义n为平滑滤波的窗口宽度,q为主成分个数,TH为相关系数阈值;设定最大窗口宽度n_MAX,最大主成分个数q_MAX,相关系数阈值遍历间隔d_TH,最大相关系数阈值TH_MAX,以及设定RBF神经网络核函数扩展因子σ,网络神经元数量m;窗口宽度n初始化为5,主成分个数q初始化为5,相关系数阈值TH初始化为0;步骤(2):光谱预处理:对校正集原始光谱矩阵Xs(s×p)逐行进行n点三阶Savitzky‑Golay卷积平滑滤波,并进行一阶求导完成光谱预处理,得到校正集预处理后光谱矩阵Xs’(s×p);步骤(3):PLS初始建模:对预处理后的s个校正集的样本利用PLS模型提取q个主成分,对预处理后光谱矩阵Xs’(s×p)及对应的样本性质矩阵Ys(s×1)进行回归建模并得到全波长PLS模型,并采取留一交叉验证的方法,得到相应的RMSECV值;步骤(4):选择模型参数:依次遍历不同的n和q,重复步骤(2)到步骤(3),直至n=n_MAX,q=q_MAX,得到不同模型参数下的RMSECV值;n和q的遍历间隔分别为2和1,选取使得RMSECV最小的n和q作为优化选取下的模型参数;步骤(5):筛选光谱矩阵:对校正集预处理后光谱矩阵Xs’(s×p)及对应样本性质矩阵Ys(s×1)展开相关分析,得到p个波长变量的相关系数,构成相关系数矩阵C(1×p);设相关系数大于设定的相关系数阈值TH的波长变量共有p’个,选取这部分波长变量对应的预处理后光谱矩阵Xs’(s×p)的子集,构成筛选后光谱矩阵Xs_selected(s×p’);步骤(6):部分波长PLS建模:在步骤(4)优化选取的模型参数下,对筛选后光谱矩阵Xs_selected(s×p’)及对应样本性质矩阵Ys(s×1)进行预处理和PLS回归建模,得到部分波长下的PLS模型,并采取留一交叉验证的方法,得到相应的RMSECV值;步骤(7):选择相关系数阈值TH:以d_TH为相关系数阈值遍历间隔,依次遍历不同的TH,重复步骤(5)至步骤(6),直至TH=TH_MAX,得到不同的RMSECV值;选取使得RMSECV最小的TH作为优化选取的相关系数阈值,建立部分波长下的优化PLS模型;步骤(8):训练RBF神经网络:将步骤(7)所得的优化模型所提取的主成分得分矩阵Score(s×q)作为输入变量,对应的样本性质矩阵Ys(s×1)作为目标变量,进行RBF神经网络的训练,得到最终的CC‑PLS‑RBFNN优化模型。...

【技术特征摘要】
1.一种基于CC-PLS-RBFNN优化模型的近红外光谱分析方法,其特征在于,所述基于CC-PLS-RBFNN优化模型的近红外光谱分析方法包括:利用三阶Savitzky-Golay卷积平滑滤波及一阶导数校正对原始光谱进行预处理;在全波长段建立PLS模型并优化选取平滑滤波的窗口宽度和PLS模型中提取的主成分个数;计算每个波长变量的相关系数,截取相关系数大于设定阈值的波长变量参与建模并优化选取阈值大小;利用优化选取的窗口宽度、主成分个数和波长变量得到优化PLS模型;用优化PLS模型提取的主成分得分矩阵和对应的样本性质矩阵训练RBF神经网络,获得最终的CC-PLS-RBFNN优化模型;具体步骤包括:步骤(1):参数初始化:将样本划分为校正集和预测集;校正集的光谱矩阵为Xs(s×p),具有s个样本,全波长点有p个,校正集的样本性质矩阵为Ys(s×1);预测集的光谱矩阵为Xt(t×p),具有t个样本,全波长点有p个,预测集的样本性质矩阵为Yt(t×1);定义n为平滑滤波的窗口宽度,q为主成分个数,TH为相关系数阈值;设定最大窗口宽度n_MAX,最大主成分个数q_MAX,相关系数阈值遍历间隔d_TH,最大相关系数阈值TH_MAX,以及设定RBF神经网络核函数扩展因子σ,网络神经元数量m;窗口宽度n初始化为5,主成分个数q初始化为5,相关系数阈值TH初始化为0;步骤(2):光谱预处理:对校正集原始光谱矩阵Xs(s×p)逐行进行n点三阶Savitzky-Golay卷积平滑滤波,并进行一阶求导完成光谱预处理,得到校正集预处理后光谱矩阵Xs’(s×p);步骤(3):PLS初始建模:对预处理后的s个校正集的样本利用PLS模型提取q个主成分,对预处理后光谱矩阵Xs’(s×p)及对应的样本性质矩阵Ys(s×1)进行回归建模并得到全波长PLS模型,并采取留一交叉验证的方法,得到相应的RMSECV值;步骤(4):选择模型参数:依次遍历不同的n和q,重复步骤(2)到步骤(3),直至n=n_MAX,q=q_MAX,得到不同模型参数下的RMSECV值;n和q的遍历间隔分别为2和1,选取使得RMSECV最小的n和q作为优化选取下的模型参数;步骤(5):筛选光谱矩阵:对校正集预处理后光谱矩阵Xs’(s×p)及对应样本性质矩阵Ys(s×1)展开相关分析,得到p个波长变量的相关系数,构成相关系数矩阵C(1...

【专利技术属性】
技术研发人员:卢建刚蒋昊
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1