一种基于LSTM的农产品品质分类方法技术

技术编号:29462339 阅读:94 留言:0更新日期:2021-07-27 17:33
本发明专利技术提出一种基于LSTM的农产品品质分类方法,包括以下步骤:A、使用农产品检测仪器,检测出农产品的外部特征a

A quality classification method of agricultural products based on LSTM

【技术实现步骤摘要】
一种基于LSTM的农产品品质分类方法
本专利技术涉及农产品品质分类方法
,具体是一种基于LSTM的农产品品质分类方法。
技术介绍
随着社会的不断进步,农产品的品质与质量越来越受到人们的重视,然而农产品品质的评价受多元化因素的影响,既要考虑外部特征因素也需要考虑内部特征因素,并且农产品在实际运输过程中随着时间的变化会对品质产生影响。因此很难对农产品的品质下以标准化得定义,也鲜有网站与机构对农产品的品质进行分类。LSTM是深度学习中有效、可靠的算法,适合用于处理与时间序列高度相关的问题。对于分类问题,以CNN为代表的前馈网络拥有着性能上的优势,但由于LSTM具有记忆细胞的特殊单元类似累加器和门控神经元,在解决长远的、更为复杂的任务上具有独特的优势。业内对于分类问题,大多采用的是传统的数理统计的方法和机器学习中的算法,在分类过程中很难处理大量、多维度的数据并且难以解决多分类的问题。因此,实际应用中此类模型难以取得理想的效果。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提出一种可以解决多分类的问题的基于LSTM的农产品品质分类方法。为实现上述目的,本专利技术采用了如下技术方案:一种基于LSTM的农产品品质分类方法,包括以下步骤:A、使用农产品检测仪器,检测出农产品的外部特征ai与内部特征bi;B、从已有的数据中提取优质、合格、不合格三个标签样本数据,并将数据进行归一化处理;C、构建基于RF的特征选择框架,将处理好的16个特征变量送入基于RF的农产品品质特征选择模型中进行农产品品质的分类预测,得出特征重要性排序;D、选取16个特征变量中关联度较大的9个特征变量,将数据导入数据编码模块,数据编码模块采用数据处理技术对提取后的数据进行编码,最后划分为训练样本集和测试样本集;E、构建基于LSTM的农产品品质分类模型;F、利用已组建的训练样本集和测试样本集,训练基于LSTM的农产品品质分类模型,确定模型参数;G、将几类待分类的农产品特征数据集,输入至训练完毕的深度学习模型中,深度学习模型输出识别分类结果。优选的,所述步骤A中,通过仪器检测出酚类含量、可溶性固形物、酒精含量、总酸、单宁等内部影响因素,通过分析天平检测出农产品重量、通过农产品检测仪检测农产品形态指数等外部影响因素。优选的,所述步骤B中,为了消除不同度量单位和方差对预测结果的不良影响,将训练集中的每一个数据特征的值进行归一化处理,且计算公式如下:其中,xi指样本,min(xi)为样本最小值,max(xi)为样本最大值。优选的,所述步骤C中,构建基于RF的农产品品质特征选择模型方法如下:C1:从原始训练集中使用Bootstraping方法有放回地重复随机抽取n个样本;C2:用n组袋外数据(OOBdata)分别计算出每一棵决策树的误差值,记作Erb1,Erb2,....,Erbk;C3:保持其他特征不变的情况下,对n组袋外数据的第i个特征进行随机重排,并重新计算误差值,记新的误差值为Eri1,Eri2,....,Erik;C4:特征重要性排序的计算公式如下:C5:基于特征对于最终结果的重要性进行排序,根据得到的最佳特征数9择出前9个特征作为特征向量送入新的模型。优选的,所述步骤D,构建数据编码模块方法如下:数据的编码方式采用one-hot的编码方式,9个特征在一次热编码过程中被编码,编码符合一下特征:在上式中,x为一个特征,包含有序集合中有可能的值。优选的,所述步骤E,构建基于LSTM的农产品品质分类模型方法如下:D1:构造多层LSTM的复合网络,本网络由两层LSTM层和三层全连接层构成,第一层LSTM层由80个神经元构成,第二层LSTM层由100个神经元构成;D2:将训练集的数据作为一个整体分别输入到第一层LSTM层的输入门it、遗忘门ft、输出门Ot中,运算的公式如下:it=sigmoid(Wiixt+bii+Whiht-1+bhi)ft=sigmoid(Wifxt+bif+Whfht-1+bhf)ot=sigmoid(Wioxt+bio+Whoht-1+bho)gt=tanh(Wigxt+big+Whght-1+bhg)ct=ftct-1+itgt其中,内部状态向量由输入门控制的每个隐藏单元写入,遗忘门决定了先前的内部状态ct-1被保留了多少;输出门还控制每个单元的激活被保留多少,接着,将第一层LSTM层输出的数据输入第二层LSTM层,最后进入三个全连接层将输出向量转换为标签向量维度;D3:模型部分中使用高效的adam优化算法,损失函数采用categorical_crossentropyloss(交叉熵损失函数),并将训练集与测试集数据输入复合网络中;D4:网络根据得到的数据多次迭代并保存高精度下的模型参数;优选的,所述步骤F中利用测试集数据对模型进行评估,获得测试集的准确率和损失值;当测试集的准确率和训练集的准确率都很低时,模型存在欠拟合问题,这时需要在模型中添加多项式特征并减少正则化参数;当测试集的准确率和训练集的准确率比其他独立数据集上的测试结果的准确率要高时,模型存在过拟合问题,这时需要在模型中加入l2正则化和Dropout算法防止模型过拟合;重复D1~D4中的步骤,并反向调节神经网络中的参数,不断优化模型提升模型的准确率至97%以上,且损失值降低至0.01以下,此时,该基于LSTM的农产品品质分类模型训练完毕。优选的,所述步骤G中利用训练完成的农产品品质分类模型对待分类的农产品进行分类的方法为:将用农产品检测仪器检测出的数据输入已经训练好的基于LSTM的农产品品质分类模型中,得到农产品品质分类的结果。与现有技术相比,本专利技术提供了一种基于LSTM的农产品品质分类方法,具有如下有益效果:本专利技术是一种基于LSTM的农产品品质分类方法,利用了RF在大量检测数据中选择出关联度对品质因素影响关联度高的数据,从而降低了繁杂数据对模型参数的干扰,一定程度上可以提高模型的准确率。同时充分利用了LSTM网络对数据的记忆特征,从而解决了在农产品品质分类受时间影响的问题。附图说明图1是本专利技术的整体步骤流程示意图;图2是本专利技术中深度学习模型框架图之一;图3是本专利技术中深度学习模型框架图之二。具体实施方式以下结合附图1-图3,进一步说明本专利技术一种基于LSTM的农产品品质分类方法的具体实施方式。本专利技术一种基于LSTM的农产品品质分类方法不限于以下实施例的描述。一种基于LSTM的农产品品质分类方法,包括以下步骤:A、使用农产品检测仪器,检测出农产品的外部特征ai与内部特征bi;B、从已有的数据中提取优质、合格、不合格三个标签样本数据,并将数据进行归一化处理;C、构建基于本文档来自技高网...

【技术保护点】
1.一种基于LSTM的农产品品质分类方法,其特征在于:包括以下步骤:/nA、使用农产品检测仪器,检测出农产品的外部特征a

【技术特征摘要】
1.一种基于LSTM的农产品品质分类方法,其特征在于:包括以下步骤:
A、使用农产品检测仪器,检测出农产品的外部特征ai与内部特征bi;
B、从已有的数据中提取优质、合格、不合格三个标签样本数据,并将数据进行归一化处理;
C、构建基于RF的特征选择框架,将处理好的16个特征变量送入基于RF的农产品品质特征选择模型中进行农产品品质的分类预测,得出特征重要性排序;
D、选取16个特征变量中关联度较大的9个特征变量,将数据导入数据编码模块,数据编码模块采用数据处理技术对提取后的数据进行编码,最后划分为训练样本集和测试样本集;
E、构建基于LSTM的农产品品质分类模型;
F、利用已组建的训练样本集和测试样本集,训练基于LSTM的农产品品质分类模型,确定模型参数;
G、将几类待分类的农产品特征数据集,输入至训练完毕的深度学习模型中,深度学习模型输出识别分类结果。


2.如权利要求1所述一种基于LSTM的农产品品质分类方法,其特征在于:所述步骤A中,通过仪器检测出酚类含量、可溶性固形物、酒精含量、总酸、单宁等内部影响因素,通过分析天平检测出农产品重量、通过农产品检测仪检测农产品形态指数等外部影响因素。


3.如权利要求1所述一种基于LSTM的农产品品质分类方法,其特征在于:所述步骤B中,为了消除不同度量单位和方差对预测结果的不良影响,将训练集中的每一个数据特征的值进行归一化处理,且计算公式如下:



其中,xi指样本,min(xi)为样本最小值,max(xi)为样本最大值。


4.如权利要求1所述一种基于LSTM的农产品品质分类方法,其特征在于:所述步骤C中,构建基于RF的农产品品质特征选择模型方法如下:
C1:从原始训练集中使用Bootstraping方法有放回地重复随机抽取n个样本;
C2:用n组袋外数据(OOBdata)分别计算出每一棵决策树的误差值,记作Erb1,Erb2,....,Erbk;
C3:保持其他特征不变的情况下,对n组袋外数据的第i个特征进行随机重排,并重新计算误差值,记新的误差值为Eri1,Eri2,....,Erik;
C4:特征重要性排序的计算公式如下:



C5:基于特征对于最终结果的重要性进行排序,根据得到的最佳特征数9择出前9个特征作为特征向量送入新的模型。


5.如权利要求1所述一种基于LSTM的农产品品质分类方法,其特征在于:所述步骤D,构建数据编码模块方法如下:
数据的编码方式采用one-hot的编码方式,...

【专利技术属性】
技术研发人员:李欣怡高羽佳张友华夏川刘飞李家清张祯
申请(专利权)人:安徽农业大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1