基于Spark的MLR模型红富士苹果树精准灌溉方法技术

技术编号:22354244 阅读:77 留言:0更新日期:2019-10-23 01:33
本发明专利技术提出了一种基于Spark的MLR模型红富士苹果树精准灌溉方法,包括胶东半岛地区红富士苹果树MLR精准灌溉模型建立和实时灌溉决策方法。所述的MLR精准灌溉模型建立包括制作影响红富士苹果树需水因子数据集;搭建分布式系统,部署Spark集群,建立MLR模型,并对模型评估完成灌水需求量的分析。所述的实时灌溉决策方法包括下位机ARM微处理器使用传感器采集环境信息,数据清洗与规范化处理,通过GPRS模块与上位机网站实时通讯,Spark对数据进行实时处理,生成决策值;若达到水量阈值,则按既定灌水定额实施灌溉,否则不作处理。本发明专利技术利用基于Spark的MLR模型的红富士苹果树精准灌溉方法,实现对胶东半岛地区红富士苹果树种植的智能浇灌与闭环控制,可提高灌溉精确性,达到优化农业生产的目的。

Precision irrigation method of Red Fuji apple tree based on spark MLR model

【技术实现步骤摘要】
基于Spark的MLR模型红富士苹果树精准灌溉方法
本专利技术涉及农业生产机器学习与精准灌溉
,特别涉及一种基于Spark的MLR模型红富士苹果树的精准灌溉方法。
技术介绍
水是苹果树生长发育的重要因素,果树在生长过程中对水分需求十分敏感。据分析,萌芽期墒情较好,才有利于萌芽长梢,土壤含水量应达到田间持水量的70%~80%;开花期土壤水分需求充足,有利于开花坐果,花期长,落花落果轻,土壤含水量应达到田间持水量的60%~70%;新梢生长、幼果发育和果实膨大期水分充足,果实发育快,但供水不能过多,水分过多时,果实个头虽大,但果肉硬度较低,含糖量也低,风味淡薄,不利于着色,也不利于贮藏,而且在贮藏期间还容易发生病害,土壤含水量应达到田间持水量的80%;成熟期水分过多会引起贪青旺长,对着色不利,成熟期水分要稳定,水分波动大,易引起裂果,土壤的含量应达到田间持水量的80%。由此可见,根据土壤实时墒情,结合果树生长状况,做出果树用水精准灌溉决策,可以保证果实的正常发育和着色。胶东半岛地区红富士果树销量大,种植面积广。传统的人工灌溉是农民根据经验实施的,它的缺点是人工监管成本高、灌溉精度差、灌溉水利用率低、灌水质量控制难度大等。相比于传统的人工灌溉,精准灌溉能够有效地克服上述缺点,实现无监督、精准施灌。随着大数据和机器学习的技术不断成熟和发展,在精准灌溉方面的技术也会慢慢成熟。国内外对此虽做过大量的研究,但灌溉模型的类别有限,研究对象集中于大田系统,很少有关果树方面的研究,更没有适于胶东半岛地区红富士果树的灌溉模型,因此,研究这一领域具有很大的经济价值与前景。专利
技术实现思路
本专利技术的目的在于提供一种基于Spark的MLR模型的红富士苹果树精准灌溉方法,通过机器学习和大数据技术解决上述技术不足,依托各种传感节点(环境温湿度、土壤水分等)和互联网可以实现红富士苹果树种植生产中关于灌水量的智能分析和决策。一种基于Spark的MLR模型的红富士苹果树精准灌溉方法,首先确定胶东半岛地区影响红富士苹果树需水的可能因素;初始化经过特征缩放后的各个因子的参数,对参数进行可靠性分析,制作数据集;搭建分布式系统,部署Spark集群;然后训练和建立MLR模型,可以实现对灌水量的预测求解;接着使用Python和MATLAB对模型评估,进行残差分析与拟合度分析。下位机ARM微处理器使用传感器采集土壤和空气温湿度信息,然后进行数据清洗与规范化处理;接着通过GPRS模块与上位机网站实时通讯;Spark对数据进行实时处理,生成决策值;若达到水量阈值,则按既定灌水定额实施灌溉,否则不作处理。本方法包括以下具体步骤:S1、搜集影响红富士苹果树生长与需水的各类特征量,经过大量实验观察与数据分析,确定苹果树的生长周期、降雨量、土壤温湿度、空气温湿度为影响苹果树需水的可能决定性因素;S2、观察苹果树长势,收集大量数据;对数据进行可靠性分析,剔除“脏”数据和骤变值;结合当日天气信息,绘制csv图表,整理制作数据集;S3、搭建分布式系统,部署Spark完全分布式集群,采用SparkOnMesos的粗粒度模式;Spark读取数据集,数据类型为DataFrame;S4、将数据集分为两批:训练集和测试集,训练集和测试集的比例为4:1;使用Box-plot图对数据进一步分析,检查有无空数据和离群数据,若有空数据,则重新采样,若有离群数据,则去除这些无用数据;S5、利用训练集构建MLR模型:needing=62.142-7.184*growth-0.114*water-0.289*soil_h+0.055*soil_t-0.020*air_h-0.064*air_t;相关系数:生长周期与需水量的相关系数为-0.975(强相关),降雨量与需水量的相关系数为-0.994(强相关),土壤湿度与需水量的相关系数为-0.984(强相关),土壤温度与需水量的相关系数为0.154(弱相关),空气湿度与需水量的相关系数为-0.774(较强相关),空气温度与需水量的相关系数为0.146(弱相关);由此模型可知最佳拟合线的截距为62.142,回归系数为[-7.184,-0.114,-0.289,0.055,-0.020,-0.064];S6、至此胶东半岛地区红富士苹果树的精准灌溉模型已经训练完毕,使用Python和MATLAB对拟合曲线进行绘制,观察曲线拟合情况,残差整体平均散布在被拟合值点附近,在整个拟合范围内具有恒定均匀的扩散,回归曲线与因变量needing拟合效果良好,没有出现过拟合现象,准确率达89.0868637081704%,从而完成灌水需求量的分析;S7、使用土壤温湿度变送器采集土壤温湿度,使用空气温湿度变送器采集空气温湿度,传感器通过RS-485通信方式将采集到的环境数据传送给ARM微处理器,ARM微处理器对采集的数据信号进行A/D转换,即将模拟信号转换为数字信号;S8、利用GPRS模块将ARM微处理器转换得到的数字信号传输给上位机网站端;S9、上位机网站端接收到土壤温湿度和空气温湿度数据,结合果树生长周期和当日天气预报信息对数据进行清洗,将不合理和误测的数据去除,并生成DataFrame数据类型的二维表形式;S10、Spark读取csv表格内容,并将csv转换为DataFrame二维表,将数据代入MLR模型,实时生成预测值;S11、若预测值达到设定的水量阈值,则按照既定灌水定额实施灌溉;若预测值没有达到设定的水量阈值,则不作处理;自此基于Spark的MLR模型的红富士苹果树精准灌溉方法完成。附图说明图1为胶东半岛地区过去70年的温度和降雨量;图2为样本数据的箱线图;图3为各特征量对标签量置信度为95%的预测线;图4为样本数据的残差图;图5为MLR模型预测值与真实值的拟合图。图6为本专利技术专利实施流程图。具体实施方式下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。下面结合图1、图2、图3、图4和图5,对本专利技术的基于Spark的MLR模型的红富士苹果树精准灌溉方法作进一步详细描述:(1)搜集影响红富士苹果树生长与需水的各类特征量,经过大量实验观察与数据分析,首先确定苹果树的生长周期、降雨量、土壤温湿度和空气温湿度为影响苹果树生长需水的可能决定性因素;然后将这些影响因素视为胶东半岛地区红富士苹果树需水的特征变量,先设置每个特征变量对应的赋值规则,并根据赋值规则对特征变量进行赋值,从而将特征变量转换为数值变量,根据果树生长周期要求和胶东半岛地区过去70年的天气状况,对赋值规则作出解释,如图1;(2)观察苹果树长势,收集大量数据;对数据进行可靠性分析,剔除“脏”数据和骤变值;结合当日天气信息,绘制csv图表,整理制作数据集;(3)搭建分布式系统,部署Spark集群,采用SparkOnMesos的粗粒度模式;Spark读取数据集,数据类型为DataFrame;(4)将数据集分为两批:训练集和测试集,训练集和测试集的比例为4:1;使用Box-plot图对数据进一步分析,检查有无空数据和离群数据本文档来自技高网
...

【技术保护点】
1.一种基于Spark的MLR模型的红富士苹果树精准灌溉方法,其特征在于,包括如下步骤:S1、搜集影响红富士苹果树生长与需水的各类特征量,经过大量实验观察与数据分析,确定苹果树的生长周期、降雨量、土壤温湿度、空气温湿度为影响苹果树需水的可能决定性因素;S2、观察苹果树长势,收集大量数据;对数据进行可靠性分析,剔除“脏”数据和骤变值;结合当日天气,绘制csv图表,整理制作数据集;S3、搭建分布式系统,部署Spark集群,采用Spark On Mesos的粗粒度模式;Spark读取数据集,数据类型为DataFrame;S4、将数据集分为两批:训练集和测试集,训练集和测试集的比例为4:1;使用Box‑plot图对数据进一步分析,检查有无空数据和离群数据,若有空数据,则重新采样,若有离群数据,则去除这些无用数据;S5、利用训练集构建MLR模型:needing=62.142‑7.184*growth‑0.114*water‑0.289*soil_h+0.055*soil_t‑0.020*air_h‑0.064*air_t;相关系数:生长周期与需水量的相关系数为‑0.975(强相关),降雨量与需水量的相关系数为‑0.994(强相关),土壤湿度与需水量的相关系数为‑0.984(强相关),土壤温度与需水量的相关系数为0.154(弱相关),空气湿度与需水量的相关系数为‑0.774(较强相关),空气温度与需水量的相关系数为0.146(弱相关);由此模型可知最佳拟合线的截距为62.142,回归系数为[‑7.184,‑0.114,‑0.289,0.055,‑0.020,‑0.064];S6、至此胶东半岛地区红富士苹果树的精准灌溉模型已经训练完毕,使用Python和MATLAB对拟合曲线进行绘制,观察曲线拟合情况,残差整体平均散布在被拟合值点附近,在整个拟合范围内具有恒定均匀的扩散,回归曲线与因变量needing拟合效果良好,没有出现过拟合现象,准确率达89.0868637081704%,从而完成灌水需求量的分析;S7、下位机ARM微处理器使用土壤温湿度变送器采集土壤温湿度,使用空气温湿度变送器采集空气温湿度,变送器与ARM微处理器之间采用RS‑485通信,ARM微处理器对采集的数据信号进行A/D转换,将模拟信号转换为数字信号;S8、利用GPRS模块将ARM微处理器转换得到的数字信号传输给上位机网站端,S9、上位机网站端接收到土壤温湿度和空气温湿度数据,结合果树生长周期和当日天气预报对数据进行清洗,将不合理和误测的数据去除;生成DataFrame数据类型的二维表形式;S10、Spark读取csv表格内容,并将csv转换为DataFrame二维表,将数据代入MLR模型,实时生成预测值;S11、若预测值达到设定的水量阈值,则按照既定灌水定额实施灌溉;若预测值没有达到设定的水量阈值,则不作处理;自此基于Spark的MLR模型的红富士苹果树精准灌溉方法完成。...

【技术特征摘要】
1.一种基于Spark的MLR模型的红富士苹果树精准灌溉方法,其特征在于,包括如下步骤:S1、搜集影响红富士苹果树生长与需水的各类特征量,经过大量实验观察与数据分析,确定苹果树的生长周期、降雨量、土壤温湿度、空气温湿度为影响苹果树需水的可能决定性因素;S2、观察苹果树长势,收集大量数据;对数据进行可靠性分析,剔除“脏”数据和骤变值;结合当日天气,绘制csv图表,整理制作数据集;S3、搭建分布式系统,部署Spark集群,采用SparkOnMesos的粗粒度模式;Spark读取数据集,数据类型为DataFrame;S4、将数据集分为两批:训练集和测试集,训练集和测试集的比例为4:1;使用Box-plot图对数据进一步分析,检查有无空数据和离群数据,若有空数据,则重新采样,若有离群数据,则去除这些无用数据;S5、利用训练集构建MLR模型:needing=62.142-7.184*growth-0.114*water-0.289*soil_h+0.055*soil_t-0.020*air_h-0.064*air_t;相关系数:生长周期与需水量的相关系数为-0.975(强相关),降雨量与需水量的相关系数为-0.994(强相关),土壤湿度与需水量的相关系数为-0.984(强相关),土壤温度与需水量的相关系数为0.154(弱相关),空气湿度与需水量的相关系数为-0.774(较强相关),空气温度与需水量的相关系数为0.146(弱相关);由此模型可知最佳拟合线的截距为62.142,回归系数为[-7.184,-0.114,-0.289,0.055,-0.020,-0.064];S6、至此胶东半岛地区红富士苹果树的精准灌溉模型已经训练完毕,使用Python和MATLAB对拟合曲线进行绘制,观察曲线拟合情况,残差整体平均散布在被拟合值点附近,在整个拟合范围内具有恒定均匀的扩散,回归曲线与因变量needing拟合效果良好,没有出现过拟合现象,准确率达89.0868637081704%,从而完成灌水需求量的分析;S7、下位机ARM微处理器使用土壤温湿度变送器采集土壤温湿度,使用空气温湿度变送器采集空气温湿度,变送器与ARM微处理器之间采用RS-485通信,ARM微处理器对采集的数据信号进行A/D转换,将模拟信号转换为数字信号;S8、利用GPRS模块将ARM微处理器转换得到的数字信号传输给上位机网站端,S9、上位机网站端接收到土壤温湿度和空气温湿度数据,结合果树生长周期和当日天气预报对数据进行清洗,将不合理和误测的数据去除;生成DataFrame数据类型的二维表形式;S10、Spark读取csv表格内容,并将csv转换为DataFrame二维表,将数据代入MLR模型,实时生成预测值;S11、若预测值达到设定的水量阈值,则按照既定灌水定额实施灌溉;若预测值没有达到设定的水量阈值,则不作处理;自此基于Spark的MLR模型的红富士苹果树精准灌溉方法完成。2.根据权利要求1所述的基于Spark的MLR模型的红富士苹果树精准灌溉方法,其特征在于,确定胶东半岛地区红富士苹果树需水的影响因素,将影响因素视为灌水定额的特征变量,设置每个特征变量对应的赋值规则,所述的方法包括:利用各个样本数据中每个特征变量的取值与对应标签量的取值,构建胶东半岛地区红富士苹果树需水预测的MLR模型的矩阵,并利用最小二乘法计算出所述矩阵中的各个特征变量的回归系数和截距;基于需要进行预测的需水量对应的各个特征变量的取值,利用所述各个特征变量的回归系数和截距计算出所述需水量的预测值。3.根据权利要求1所述的基于Spark的MLR模型的红富士苹果树精准灌溉方法,其特征在于,所述的需水量的影响因素,将影响因素视为胶东半岛地区红富士苹果树需水的特征变量,设置每个特征变量对应的...

【专利技术属性】
技术研发人员:白皓然郭若皓李凤梅王高弟宋晨勇
申请(专利权)人:青岛农业大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1