一种无花果采收时间点的预测方法技术

技术编号：28737773 阅读：32 留言：0更新日期：2021-06-06 12:39

本公开涉及一种无花果采收时间点的预测方法，包括：(1)将通过随机森林算法获得的F值向量进行最大最小标准化，将F数据范围化到[0,1]，则为成熟度(％)；(2)基于近红外光谱预测待测样品的F值：(3)计算待测样品的成熟度：(4)以成熟度为输入变量X，预设时间点为输出变量Y，采用多项式拟合方法得出无花果采收时间点预测模型，根据此模型可计算并获得无花果采收时间点。本公开采用随机森林算法建立综合评价值F与近红外光谱之间的预测模型，以及采用多项式拟合方法得出无花果采收时间点预测模型，该预测方法快速、方便和准确。方便和准确。方便和准确。

全部详细技术资料下载

【技术实现步骤摘要】
一种无花果采收时间点的预测方法

[0001]本公开涉及一种无花果采收时间点的预测方法。

技术介绍

[0002]公开该
技术介绍
部分的信息仅仅旨在增加对本公开的总体背景的一些理解，而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术。
[0003]无花果(Ficus carica Linn.)，属于桑科榕属，起源于中东是人类最早种植的植物之一，并且是全世界用于干燥和新鲜食用的重要农作物。无花果富含纤维、多糖、多酚、铁，钾和钙等微量元素的营养水果。无花果果肉柔软，味甜，具有健脾清肠、润肺利咽和提高免疫力等功效。
[0004]目前确定无花果较佳采收时间是主要是根据经验和目测判断，获得的结果缺乏一定的客观性和准确性，难以在现代生产和营销中心应用。随着无花果产业规模化和集约化进程的加快，传统的采收时间点的预测技术已经不能适应无花果产业发展的需求。

技术实现思路

[0005]针对以上
技术介绍
，本公开提出一种无花果采收时间点的预测方法，该预测方法快速、方便和准确。
[0006]具体的，本公开采用以下技术方案：
[0007]在本公开的第一个方面，提供一种关于预测无花果采收时间点的F值预测模型的建立方法，该方法包括以下步骤：
[0008]采用随机森林算法，输入变量为近红外光谱矩阵X，变量X构成CART决策树的特征空间，综合指标F值向量为输出变量Y，建立F值预测模型；
[0009]其中，近红外光谱为训练集中无花果预处理后的近红外光谱值；/>[0010]综合评价值F是通过以下方法计算得到的：
[0011]对训练集中无花果糖度、单果重、横径、纵径和硬度指标进行主成分分析(PCA)，统计其成分得分系数矩阵和各成分的贡献率，通过成分得分系数矩阵建立各主成分的计算表达式；
[0012]根据综合评价值函数计算并获得训练集中每个无花果的综合评价值F，其中权数为贡献率F
i
，记主成分为
[0013]在本公开的第二个方面，提供一种无花果采收时间点的预测方法，该方法包括以下步骤：
[0014](1)将第一个方面中所述的建立方法获得的F值向量进行最大最小标准化，将F数据范围化到[0,1]，则为成熟度(％)；计算公式为：
[0015]成熟度(％)＝(F
‑
min(F))/(max(F)
‑
min(F))；
[0016](2)基于近红外光谱预测待测样品的F值：
[0017]测定待测样品的近红外光谱，然后对测定的近红外光谱数据进行预处理，通过所述F值预测模型，获得待测样品的F值；
[0018](3)计算待测样品的成熟度：
[0019]将步骤(2)中的待测样品的F值代入步骤(1)中所述成熟度的计算公式，获得待测样品的成熟度；
[0020](4)以成熟度为输入变量X，预设时间点为输出变量Y，采用多项式拟合方法得出无花果采收时间点预测模型，根据此模型可计算并获得无花果采收时间点。
[0021]与本专利技术人知晓的相关技术相比，本公开其中的一个技术方案具有如下有益效果：
[0022]本公开采用随机森林算法建立综合评价值F与近红外光谱之间的预测模型，随机森林算法是一种灵活的，便于使用的机器学习算法，在本公开中，即使没有超参数调整，也会产生较好的效果，且具有强大的拟合能力和不易过拟合的性能，算法稳定。
[0023]采用拟合得出的多项式对验证集进行预测，得出预测值与真实值的判定系数(拟合优度)接近1，误差较小，表明采用综合评价F值关联生长天数和近红外光谱得到的预测模型能够较好地预测无花果采收时间点。
附图说明
[0024]构成本公开一部分的说明书附图用来提供对本公开的进一步理解，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。
[0025]图1是无花果的原始光谱。
[0026]图2是无花果成熟度和实际生长天数的多项式拟合曲线。
[0027]图3是无花果真实生长天数与预测生长天数的散点分布图。
具体实施方式
[0028]应该指出，以下详细说明都是示例性的，旨在对本公开提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本公开所属
的普通技术人员通常理解的相同含义。
[0029]需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本公开的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作和/或它们的组合。
[0030]正如
技术介绍
所介绍的，目前现有的无花果采收时间点的预测方法存在不准确和不客观等缺点，为了解决如上的技术问题，本公开的基本思路是：先选择一个样本群体，根据样本群体的特征指标
‑
无花果糖度、单果重、横径、纵径和硬度进行主成分分析，通过主成分分析降维得到个数较少的主成分指标，根据各主成分指标计算特征值F(或称综合指标F值)，通过大量试验验证，特征值F与成熟度存在一定线性关系，通过将特征值F进行标准化，将标准化后的特征值F与生长天数进行关联，即可获得成熟度与生长天数的关系；而样本群体的特征指标
‑
无花果糖度、单果重、横径、纵径和硬度与近红外光谱具有一定的关系，从而建立近红外光谱与特征值F的联系。基于此，在本公开的第一个典型的实施方式中，提供一
种关于预测无花果采收时间点的F值预测模型的建立方法，该方法包括以下步骤：
[0031]采用随机森林算法，输入变量为近红外光谱矩阵X，变量X构成CART决策树的特征空间，综合指标F值向量为输出变量Y，建立F值预测模型；
[0032]其中，近红外光谱为训练集中无花果预处理后的近红外光谱值；
[0033]综合评价值F是通过以下方法计算得到的：
[0034]对训练集中无花果糖度、单果重、横径、纵径和硬度指标进行主成分分析(PCA)，统计其成分得分系数矩阵和各成分的贡献率，通过成分得分系数矩阵建立各主成分的计算表达式；
[0035]根据综合评价值函数计算并获得训练集中每个无花果的综合评价值F，其中权数为贡献率F
i
，记主成分为
[0036]在本公开的一个或一些实施方式中，所述方法基于Python的scikit
‑
learn库进行建模。
[0037]在本公开的一个或一些实施方式中，随机森林算法模型中选择基学习器数量为100，随机数种子为0。
[0038]在本公开的一个或一些实施方式中，输入变量为近红外光谱矩阵X，矩阵X由m个自变量x1,x2,...,xm组成，m为波长数，变量X构成CART决策树的特征空间；综合指标F值向量为输出变量Y，由n个因变量y1,y2,...,yn组成，n为样本个数；n个样本作为训练集数据构成训练本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种关于预测无花果采收时间点的F值预测模型的建立方法，其特征是，该方法包括以下步骤：采用随机森林算法，输入变量为近红外光谱矩阵X，变量X构成CART决策树的特征空间，综合指标F值向量为输出变量Y，建立F值预测模型；其中，近红外光谱为训练集中无花果预处理后的近红外光谱值；综合评价值F是通过以下方法计算得到的：对训练集中无花果糖度、单果重、横径、纵径和硬度指标进行主成分分析，统计其成分得分系数矩阵和各成分的贡献率，通过成分得分系数矩阵建立各主成分的计算表达式；根据综合评价值函数计算并获得训练集中每个无花果的综合评价值F，其中权数为贡献率F
i
，记主成分为2.如权利要求1所述的建立方法，其特征是，所述方法基于Python的scikit
‑
learn库进行建模。3.如权利要求1所述的建立方法，其特征是，随机森林算法模型中选择基学习器数量为100，随机数种子为0。4.如权利要求1所述的建立方法，其特征是，输入变量为近红外光谱矩阵X，矩阵X由m个自变量x1，x2，...，xm组成，m为波长数，变量X构成CART决策树的特征空间；综合指标F值向量为输出变量Y，由n个因变量y1，y2，...，yn组成，n为样本个数；n个样本作为训练集数据构成训练样本空间，则训练数据集D为：D＝{(x1，y1)，(x2，y2)，...，(x
n
，y
n
)}。5.如权利要求1所述的建立方法，其特征是，对近红外光谱预处理的方法包括：未处理、多元散射校正(MSC)、标准正态变量(SNV)、Baseline、Baseline+SNV、Smoothing、1阶导数和MSC的组合、2阶导数和MSC的组合；进一步的，采用Smoothing对近红外光谱进行预处理。6.如权利要求1所述的建立方法，其特征是，综合...

【专利技术属性】
技术研发人员：韩燕苓，孙锐，余多，
申请(专利权)人：齐鲁工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人