基于集成学习的果蔬高光谱品质检测方法技术

技术编号:20026342 阅读:25 留言:0更新日期:2019-01-06 05:07
本发明专利技术公开了一种基于集成学习的果蔬高光谱品质检测方法,基于集成学习的果蔬高光谱品质检测方法主要是利用集成学习方法对现有高光谱品质检测算法进行融合,并建立果蔬品质的无损检测方法。该方法首先建立基于bagging+adaboost的集成检测框架,对多种特征波段优选方法,以及光谱数据和品质数据的相关分析方法进行融合,然后在此基础上利用实测的果蔬光谱和品质数据进行训练,得到可用于无损品质检测的预测模型。

【技术实现步骤摘要】
基于集成学习的果蔬高光谱品质检测方法
本专利技术属于果蔬检测领域,具体是一种基于集成学习的果蔬高光谱品质检测方法。
技术介绍
高光谱成像系统能获取波长400-1000nm内连续的光谱曲线,波长数众多(有几百甚至上千波长组成),有很多信息是重复的或者是无用信息,甚至是影响到数据模型结果的噪声数据,这对数据分析中模型的准确度、分析的速度都非常不利,也会影响便携式仪器的开发。同时,因为光谱数据信息本身冗余,高光谱成像通常是严重重叠在一起,以致特征吸收峰不明显。因此,通常的做法是采用一定的方法寻找到对于建模有效的波长变量,删除冗余变量,减少波长变量个数,优化模型,提升模型预测精确,我们称为特征变量选择。特征波长选择方法主要有无信息变量消除法、连续投影算法、遗传算法等,当前相关分析的方法如基于线性的偏最小二乘,多元线性回归及基于非线性的神经网络和支持向量机的,以往都是讲各种单一算法进行对比,优选性能最优提取及相关分析算法来进行作为最终算法。针对采集的数据集某种单一算法表现好,但是如果数据集的改变,相应的最优提取方法也可能随之改变。如果处理预测信息复杂的话,单一特征提取算法出现错误的概率就会越来越大,这样的模型适应性比较弱,现实当中复杂的。现有的技术方案有如:无信息变量消除法、连续投影算法、遗传算法都是本专利下的子方法,本专利专利技术将所有的自算法进行融合,集成多个算法成的特征提取器具有比成员提取方法更强的泛化能力。来预测苹果内部品质,提升预测模型性能,稳定性,准确性。高光谱无损检测品质分析当中,如预测苹果的糖度、硬度、水分等内部品质高光谱检测。针对采集的数据集某种单一算法表现好,但是如果数据集的改变,相应的最优提取和相关性分析方法也可能随之改变。在其研究领域,虽然有很多不同的方法来预测各自领域对象的内部信息,通过对比相关的预测算法。一般来说,这些方法预测得到的结果不是非常稳定和强大的。存在单一性,并不稳定。若同一研究对象下数据的改变可能导致分析结果不同,如果处理预测信息复杂的话,单一特征提取算法出现错误的概率就会越来越大,这样的模型适应性比较弱,现实当中复杂的。学习一个具有较强泛化能力的特征提取,相关性分析技术也成为一个艰巨的任务。
技术实现思路
本专利技术根据每种特征提取算法和相关性分析算法的设计原理不同,考虑添加集成学习的技术,集成多个算法成的特征提取器具有比成员提取方法更强的泛化能力。来预测苹果内部品质,提升预测模型性能,稳定性,准确性。技术方案:一种基于集成学习的果蔬高光谱品质检测方法,开始,选择样本并投入高光谱数据其品质数据,设置并选取若干特征提取的方法,将方法添加到集成学习框架中去,进行分别特征提取;然后由异态集成学习中元学习法针对回归的思想,将每个算法的得到优选波段序号进行加权融合,最终作为融合后得最终提取波段;其次基于bagging+adaboost框架下的多算法高光谱与品质相关分析模型的建立,根据基于集成学习的高光谱和品质相关性分析方法,投入特征高光谱数据、蔬果品质数据;训练数据的设置,默认为训练集为80%,测试集为20%;设置bagging随机抽取比例设置80%-90%,将高光谱数据和品质数据作为原始数据集,将原始数据集进行若干次随机抽样得到若干次新的数据集,设置并选取若干回归分析方法,将方法添加到bagging+adaboost框架中去,依次对新的数据集进行分别回归建模分析,最后根据评价因子得到最终预测模型。优选的,所述bagging+adaboost框架:Bagging随机抽取比例设置形成s次随机,将原始数据集进行随机抽样得到s个新的数据集,依次运用adaboost训练新数据集合进行训练学习,减小弱分类器分类效果较好的数据的概率,增大弱分类器分类效果较差的数据的概率,最终分类器是多个弱分类器的加权平均;思路为设置并选取若干回归分析方法,将方法添加到bagging+adaboost框架中去,依次将新数据集进行回归建模分析,返回结果为各自回归模。优选的,所述集成学习的高光谱和品质相关性分析方法:特征高光谱数据记为X(n,p);蔬果品质数据记为Y(n,1);n为样本数,p为特征波段变量数,第一步:训练数据的设置,默认为训练集占样本数的80%,测试集占20%;第二步:设置bagging随机抽取比例80%-90%,将原始数据集进行s次随机抽样得到s个新的数据集,每个数据集为N个样本;第三步:设置并选取m个回归分析方法,将分析方法添加到bagging+adaboost框架中去,依次对s个新的数据集进行分别回归建模分析,返回结果为各自回归模型。第四步:通过训练,每个训练集得出对应f(x),即{f1(x),f2(x),…,fs(x)},融合依据为均方根误差权重如下:F(x)=b1f1(x)+b2f2(x).......+bsfs(x)(b1+b2+b3+.......+bs=1)其中:zi为对应函数f的均方根误差,Z为所有均分根误差和,bi为均方根误差因子,F(x)为最终预测函数。更优的,所述集成学习的高光谱和品质相关性分析方法第三步的具体过程如下:301:初始化训练数据的权重分布,第i个训练样本最开始时被赋予同样的权重Wm,i,初始权重为1/N。其中:Wm,i为第m次迭代第i个训练样本对应的权重(1≤i≤N);302:针对训练数据选取弱回归算法进行训练y=Cm(x),其中:m为迭代序号;303:计算训练中样本误差值,第i个误差值ξi:ξi=∑Wi(k)|Ci(xk)-yi|其中:i为样本序号,k为样本集序号(1≤k≤s),Ci所选的回归算法,yi为第i样本的真实值。304:计算弱分类器对应的权重α:其中:αm为第m个次迭代使用的回归算法权重,ξi第i个样本误差值;305:更新训练集的权重分布(目的得到样本的新权值分布),用于下一轮迭代:Dm+1=(Wm+1,1,Wm+1,2,…,Wm+1,N)其中:Dm+1为m+1次下的权重集合,Wm+1,i为m+1次下第i个权值,Zm为m次迭代的规范化因子,且Zm=Sum(Wi);306:组合各个弱回归模型从而得到次最终回归模型,如下:其中:αm和Cm(x)分别为第m次迭代中对应的算法的权值及算法函数。本专利技术的有益效果高光谱无损检测品质分析当中,如预测苹果的糖度、硬度、水分等内部品质高光谱检测。针对采集的数据集某种单一算法表现好,但是如果数据集的改变,相应的最优提取和相关性分析方法也可能随之改变。在其研究领域,虽然有很多不同的方法来预测各自领域对象的内部信息,通过对比相关的预测算法。一般来说,预测这些方法得到的结果不是非常稳定和强大的。存在单一性,并不稳定。若同一研究对象下数据的改变可能导致分析结果不同,如果处理预测信息复杂的话,单一特征提取算法出现错误的概率就会越来越大,这样的模型适应性比较弱,现实当中复杂的。本专利技术学习一个具有较强泛化能力的特征提取,相关性分析技术。本专利技术根据每种特征提取算法和相关性分析算法的设计原理不同,考虑添加集成学习的技术,集成多个算法成的特征提取器具有比成员提取方法更强的泛化能力。来预测苹果内部品质,提升预测模型性能,稳定性,准确性。附图说明图1为本专利技术基于集成学习的高光谱品质检测流程图图2为本专利技术集成框架工作流程图具体实施方式下面结合实施本文档来自技高网
...

【技术保护点】
1.一种基于集成学习的果蔬高光谱品质检测方法,其特征在于:开始,选择样本并投入高光谱数据其品质数据,设置并选取若干特征提取的方法,将方法添加到集成学习框架中去,进行分别特征提取;然后由异态集成学习中元学习法针对回归的思想,将每个算法的得到优选波段序号进行加权融合,最终作为融合后得最终提取波段;其次基于bagging+adaboost框架下的多算法高光谱与品质相关分析模型的建立,根据基于集成学习的高光谱和品质相关性分析方法,投入特征高光谱数据、蔬果品质数据;训练数据的设置,默认为训练集为80%,测试集为20%;设置bagging随机抽取比例设置80%‑90%,将高光谱数据和品质数据作为原始数据集,将原始数据集进行若干次随机抽样得到若干次新的数据集,设置并选取若干回归分析方法,将方法添加到bagging+adaboost框架中去,依次对新的数据集进行分别回归建模分析,最后根据评价因子得到最终预测模型。

【技术特征摘要】
1.一种基于集成学习的果蔬高光谱品质检测方法,其特征在于:开始,选择样本并投入高光谱数据其品质数据,设置并选取若干特征提取的方法,将方法添加到集成学习框架中去,进行分别特征提取;然后由异态集成学习中元学习法针对回归的思想,将每个算法的得到优选波段序号进行加权融合,最终作为融合后得最终提取波段;其次基于bagging+adaboost框架下的多算法高光谱与品质相关分析模型的建立,根据基于集成学习的高光谱和品质相关性分析方法,投入特征高光谱数据、蔬果品质数据;训练数据的设置,默认为训练集为80%,测试集为20%;设置bagging随机抽取比例设置80%-90%,将高光谱数据和品质数据作为原始数据集,将原始数据集进行若干次随机抽样得到若干次新的数据集,设置并选取若干回归分析方法,将方法添加到bagging+adaboost框架中去,依次对新的数据集进行分别回归建模分析,最后根据评价因子得到最终预测模型。2.根据权利要求1所述的基于集成学习的果蔬高光谱品质检测方法,其特征在于所述bagging+adaboost框架:Bagging随机抽取比例设置形成s次随机,将原始数据集进行随机抽样得到s个新的数据集,依次运用adaboost训练新数据集合进行训练学习,减小弱分类器分类效果较好的数据的概率,增大弱分类器分类效果较差的数据的概率,最终分类器是多个弱分类器的加权平均;思路为设置并选取若干回归分析方法,将方法添加到bagging+adaboost框架中去,依次将新数据集进行回归建模分析,返回结果为各自回归模。3.根据权利要求1所述的及预计称学习的果树高光谱品质检测方法,其特征在于所述集成学习的高光谱和品质相关性分析方法:特征高光谱数据记为X(n,p);蔬果品质数据记为Y(n,1);n为样本数,p为特征波段变量数,第一步:训练数据的设置,默认为训练集占样本数的80%,测试集占20%;第二步:设置bagging随机抽取比...

【专利技术属性】
技术研发人员:海兵帅
申请(专利权)人:南京农业大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1