当前位置: 首页 > 专利查询>江南大学专利>正文

一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法技术

技术编号:18891764 阅读:106 留言:0更新日期:2018-09-08 09:44
本发明专利技术提供一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法,属于苹果糖度预测领域。该方法首先从苹果的近红外光谱中提取相对反射率作为特征参数,然后利用初始最小二乘支持向量机回归模型Mlssvm和偏最小二乘回归模型Mplsr对未标记样本预测,获得预测值;随后求未标记样本与回归模型Mlssvm或Mplsr所用建模样本的最大距离和两个回归模型对未标记样本的预测差异;之后选取距离大和两个回归模型预测差异小的未标记样本作为更新集样本加入到初始回归模型Mlssvm或Mplsr所用建模样本中,更新初始回归模型Mlssvm或Mplsr;直至满足最大迭代次数后对测试集样本进行标定。本发明专利技术利用距离度量和半监督学习对初始模型进行更新,预测精度高、操作简单、快速有效、具有较高的鲁棒性。

A near-infrared spectral prediction method for apple sugar content based on distance measurement and semi supervised learning

The invention provides a near infrared spectroscopy cross-year apple sugar prediction method based on distance measurement and semi-supervised learning, belonging to the field of apple sugar prediction. The method firstly extracts the relative reflectance from the near infrared spectra of apples as the characteristic parameter, then uses the initial least squares support vector machine regression model Mlssvm and the partial least squares regression model Mplsr to predict the unmarked samples, and then obtains the predicted values of the unmarked samples and the model samples used in the regression model Mlssvm or Mplsr. The maximum distance and the difference between the two regression models in the prediction of unlabeled samples were used to update the original regression model Mlssvm or Mplsr, and then the unlabeled samples with large distance and small difference between the two regression models were selected as update set samples to update the initial regression model Mlssvm or Mplsr until the maximum overlap was satisfied. The test set samples are calibrated after generation times. The invention uses distance measurement and semi-supervised learning to update the initial model, with high prediction accuracy, simple operation, fast and effective, and high robustness.

【技术实现步骤摘要】
一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法
本专利技术属于苹果糖度预测领域,具体涉及一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法。
技术介绍
苹果具有营养价值高、可存储时间长等特点,已成为世界性的果品。随着生活水平的提高和消费的多元化,消费者对水果品质和安全要求越来越高,苹果品质与安全已经成为消费者最为关注的因素。在同样安全的条件下,消费者越来越注重苹果内在品质,例如苹果的糖度。如何快速对苹果内部品质进行检测和分级,不仅关系到消费者的食用品质和安全保障,而且直接影响到苹果的进出口贸易。国内外学者对苹果的糖度预测进行了研究,如机器视觉、近红外光谱等。其中,近红外光谱能够反映苹果内部化学特征,被广泛应用于苹果糖度预测。对于跨年份相同品种的苹果,本方法采集的近红外光谱信息引入新的变量,考虑了耕作条件、土壤环境条件和气候变化,而原有的训练集样本并没有考虑这些新的变量,降低了开发模型的准确性和鲁棒性。
技术实现思路
本专利技术目的是克服以上的缺点,提供一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法,提高模型的预测精度,操作简单,并具有较高的鲁棒性等优点。本专利技术的技术方案:一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法,步骤如下:a、将N个未标记苹果样本分别放置在近红外光谱采集系统中,采集并获取未标记苹果样本在B个波段下的近红外光谱,所述的未标记苹果样本为当年苹果样本;b、利用一阶导数来最小化近红外光谱的基线偏移并增强吸收峰;提取B个波段下近红外光谱的相对反射率,作为未标记苹果样本的特征参数F;c、将步骤b中所得未标记苹果样本的特征参数F,输入预先建立或更新的最小二乘支持向量机回归模型Mlssvm和偏最小二乘回归模型Mplsr中,获得未标记苹果样本糖度的初始预测值和所述预先建立的回归模型Mlssvm和Mplsr中的建模样本为上一年采集的苹果样本;d、计算N个未标记苹果样本到模型Mlssvm(或模型Mplsr)所用建模样本的最大距离和其中,是第i个未标记苹果样本到模型Mlssvm(或模型Mplsr)所用建模样本的最大距离,是第i个未标记苹果样本到模型Mlssvm(或模型Mplsr)所用建模样本的最大距离,和是由两个不同公式计算出的最大距离;e、计算最小二乘支持向量机回归模型Mlssvm和偏最小二乘回归模型Mplsr对N个未标记苹果样本的预测差异E=[e1,...,ei,...,eN],其中,|.|表示求绝对值;f、分别从D1和D2中选取最大距离值大的q个未标记苹果样本,将q个未标记苹果样本及其真实糖度值分别放入和g、从E中选取预测差异值小的q个未标记苹果样本,将q个未标记苹果样本及其糖度初始预测值放入到h、令L=[L1,L2,L3],将L加入模型Mlssvm或模型Mplsr所用建模样本中,实现模型Mlssvm或Mplsr的更新,并且将L从未标记的N个未标记苹果样本中剔除;i、重复步骤c-h,直到满足最大迭代次数T;j、将M个待预测的苹果样本放置在近红外光谱采集系统中,采集并获取该M个待预测的苹果样本在B个波段下的近红外光谱,所述待预测的苹果样本为当年苹果样本;k、利用一阶导数来最小化近红外光谱的基线偏移并增强吸收峰;提取B个波段下近红外光谱的相对反射率,作为待预测苹果样本的特征参数F;l、将待预测的苹果样本的特征参数F带入更新的模型Mlssvm(或模型Mplsr)中,对待预测苹果样本进行预测。所述步骤d中,最大距离的计算表达式为:其中,Ui表示第i个未标记苹果样本的光谱特征,Sj表示第j个已建立模型的训练集样本的光谱特征,表示训练集第j个样本的真实糖度值;表示已建立模型对第i个未标记苹果样本的预测糖度值或者||.||计算马氏距离。本专利技术的有益效果:本专利技术的目的是克服现有技术存在的缺点,提供一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法,其能够提高跨年份苹果糖度预测精度,操作简单,快速有效,并具有较高的鲁棒性等优点。附图说明图1为根据本专利技术基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法流程示意图。图2(a)为模型Mplsr更新前的测试集糖度真实值与预测值的散点图。图2(b)为模型Mplsr更新后的测试集糖度真实值与预测值的散点图。图3(a)为模型Mlssvm更新前的测试集糖度真实值与预测值的散点图。图3(b)为模型Mlssvm更新后的测试集糖度真实值与预测值的散点图。具体实施方式以下结合具体附图和实施例对本专利技术做进一步说明。如图1所示:一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法,步骤如下:苹果品种选取金冠苹果(GoldenDelicious),取自2009年的782个苹果样本作为回归模型的训练集,取自2010年的600个未标记苹果样本作为未标记集,另取2010年的600个待预测苹果样本作为待预测集。a、将600个未标记苹果样本分别放置在近红外光谱采集系统中,采集并获取未标记苹果样本在129个波段下的近红外光谱;b、利用一阶导数来最小化近红外光谱的基线偏移并增强吸收峰;提取129个波段下近红外光谱的相对反射率,作为未标记苹果样本的特征参数F;c、将步骤b中所得未标记苹果样本的特征参数F,输入预先建立或更新的最小二乘支持向量机回归模型Mlssvm和偏最小二乘回归模型Mplsr中,获得未标记苹果样本糖度的初始预测值和d、计算600个未标记苹果样本到模型Mlssvm(或模型Mplsr)所用建模样本的最大距离和最大距离的计算表达式为:其中,是第i个未标记苹果样本到模型Mlssvm(或模型Mplsr)所用建模样本的最大距离,是第i个未标记苹果样本到模型Mlssvm(或模型Mplsr)所用建模样本的最大距离,和是由两个不同公式计算出的最大距离;Ui表示第i个未标记苹果样本的光谱特征,Sj表示第j个已建立模型的训练集样本的光谱特征,表示训练集第j个样本的真实糖度值;表示已建立模型对第i个未标记苹果样本的预测糖度值或者||.||计算马氏距离;e、计算最小二乘支持向量机回归模型Mlssvm和偏最小二乘回归模型Mplsr对600个未标记苹果样本的预测差异E=[e1,...,ei,...,e600],其中,|.|表示求绝对值;f、分别从D1和D2中选取最大距离值大的5个未标记苹果样本,将5个未标记苹果样本及其真实糖度值分别放入和g、从E中选取预测差异值小的5个未标记苹果样本,将5个未标记苹果样本及其糖度初始预测值放入到h、令L=[L1,L2,L3],将L加入模型Mlssvm或模型Mplsr所用建模样本中,实现模型Mlssvm或Mplsr的更新,并且将L从未标记的600个未标记苹果样本中剔除;i、重复步骤c-h,直到满足最大迭代次数10;j、将600个待预测的苹果样本放置在近红外光谱采集系统中,采集并获取该600个待预测的苹果样本在129个波段下的近红外光谱;k、利用一阶导数来最小化近红外光谱的基线偏移并增强吸收峰;提取129个波段下近红外光谱的相对反射率,作为待预测苹果样本的特征参数F;l、将待预测的苹果样本的特征参数F带入更新的模型Mlssvm(或模型Mplsr)中,对待预测苹果样本进行预测。利用模型Mplsr更新的实验本文档来自技高网...

【技术保护点】
1.一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法,其特征在于,步骤如下:a、将N个未标记苹果样本分别放置在近红外光谱采集系统中,采集并获取未标记苹果样本在B个波段下的近红外光谱,所述的未标记苹果样本为当年苹果样本;b、利用一阶导数来最小化近红外光谱的基线偏移并增强吸收峰;提取B个波段下近红外光谱的相对反射率,作为未标记苹果样本的特征参数F;c、将步骤b中所得未标记苹果样本的特征参数F,输入预先建立或更新的最小二乘支持向量机回归模型Mlssvm和偏最小二乘回归模型Mplsr中,获得未标记苹果样本糖度的初始预测值

【技术特征摘要】
1.一种基于距离度量和半监督学习的近红外光谱跨年份苹果糖度预测方法,其特征在于,步骤如下:a、将N个未标记苹果样本分别放置在近红外光谱采集系统中,采集并获取未标记苹果样本在B个波段下的近红外光谱,所述的未标记苹果样本为当年苹果样本;b、利用一阶导数来最小化近红外光谱的基线偏移并增强吸收峰;提取B个波段下近红外光谱的相对反射率,作为未标记苹果样本的特征参数F;c、将步骤b中所得未标记苹果样本的特征参数F,输入预先建立或更新的最小二乘支持向量机回归模型Mlssvm和偏最小二乘回归模型Mplsr中,获得未标记苹果样本糖度的初始预测值和所述预先建立的回归模型Mlssvm和Mplsr中的建模样本为上一年采集的苹果样本;d、计算N个未标记苹果样本到模型Mlssvm或模型Mplsr所用建模样本的最大距离和其中,是第i个未标记苹果样本到模型Mlssvm或模型Mplsr所用建模样本的最大距离,是第i个未标记苹果样本到模型Mlssvm或模型Mplsr所用建模样本的最大距离,和是由两个不同公式计算出的最大距离;e、计算最小二乘支持向量机回归模型Mlssvm和偏最小二乘回归模型Mplsr对N个未标记苹果样本的预测差异E=[e1,...,ei,...,eN],其中,|.|表示求绝对值;f、分别从D1和D2中选取最大...

【专利技术属性】
技术研发人员:朱启兵郭东生黄敏郭亚
申请(专利权)人:江南大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1