一种基于大数据的大豆生产的优化方法技术

技术编号:19935369 阅读:42 留言:0更新日期:2018-12-29 04:57
本发明专利技术公开了一种基于大数据的大豆生产的优化方法。该方法包括获取影响大豆物质投入、费用投入和化肥投入的指标;去除所述指标中的多重共线性指标、数据缺失指标,获得筛选指标;根据所述筛选指标查询相对应的指数;将每种所述指数按列取累乘得到每一年相对首期的相对变化量;根据所述相对变化量计算涉及价格、成本、费用、利润和收入的投入量;采用Lasso回归模型筛选所述指数,获得压缩指数;根据所述压缩指数计算大豆品种在全国的投入单产。采用Lasso回归模型分析获得影响各类大豆单产各影响因素的量化情况,能够优化生产获得更加科学合理的大豆投入生产方式。

【技术实现步骤摘要】
一种基于大数据的大豆生产的优化方法
本专利技术涉及农业生产领域,特别是涉及一种基于大数据的大豆生产的优化方法。
技术介绍
随着物联网、移动互联、地理信息等信息技术的迅速发展,农业呈现出信息爆发的趋势,农业正跨步迈入大数据的时代。大数据的理念和技术既带来了机遇也带来了挑战。中国是世界第一大农业生产国,巨大的产量背后的资源承载可持续性艰难,过度地依赖高物耗高投入的粗犷性发展模式不可持续。中国农业从业人员2.7亿,但劳动生产率仅为世界的64%;有效灌溉面积0.63亿公顷,但农田灌溉水有效利用系数仅为0.52,远低于发达国家0.7-0.8的水平,喷洒农药180万吨,但利用率仅仅为35%,比发达国家低10个百分点,化肥施用折纯量5900万吨,但综合利用率大概在30%左右;农机总动力10.7亿万瓦,农作物耕种收综合机械水平达到60%,农业科技进步贡献率55.6%。中国的农产品产量提升主要依靠化肥、农药、劳动力投入品的增加。在农业生产过程中,生产的投入因素可以分为两大类:1、农业生产过程中所需购买和租用的生产要素,例如:化肥用量、农药用量、农膜用量;2、农业劳动力投入。我国农业生产由于农药与化肥投入量过高和投入产值率过低,导致了农药与化肥投入量的提高已不能够带来农产品单位面积产量的增加,也是我们主要大豆产区化肥、农药投入产出弹性为负的主要原因。而中国绝大部分地区的劳动力产值率高,劳动力投入的提高仍然能够带来大豆单位面积产量的显著增加,需要对农业大数据的进一步分析。在农业大数据的分析中经常会遇到高维度的数据,高维度数据的变量空间维度较高,但是数据样本的维度并不高,过少的样本会导致过拟合问题,模型的适用范围差,特别是当样本数量小于变量数时会出现模型求解的欠定问题。
技术实现思路
本专利技术的目的是提供一种能够解决大数据分析过程中的过少的样本导致的过拟合问题的基于大数据的大豆生产的优化方法。为实现上述目的,本专利技术提供了如下方案:一种基于大数据的大豆生产的优化方法,所述优化方法包括:获取影响大豆物质投入、费用投入和化肥投入的指标;去除所述指标中的多重共线性指标、数据缺失指标,获得筛选指标;根据所述筛选指标查询相对应的指数;将每种所述指数按列取累乘得到每一年相对首期的相对变化量;根据所述相对变化量计算涉及价格、成本、费用、利润和收入的投入量;采用Lasso回归模型筛选所述指数,获得压缩指数;根据所述压缩指数计算大豆品种在全国的投入单产。可选的,所述Lasso回归模型的函数为其中,w为回归方程的系数向量,X为所述指标,YI为观测值向量,α为自变量的系数,m为最优所述指标数目,N表示所述指标的总数,l1为正则项。可选的,所述根据所述压缩指数计算大豆品种在全国的投入单产具体包括:全国的投入单产其中,成本收益情况因素向量,费用和用工情况因素向量,为化学肥料投入因素向量,β1YI为成本收益情况因素对应的回归方程的系数向量,β2YI为费用和用工情况因素对应的回归方程的系数向量,β3YI为化学肥料投入因素对应的回归方程的系数向量。可选的,所述筛选指标具体指:每亩主产品产量,每亩产值合计,每亩总成本,每亩净利润,每亩现金成本,每亩现金收益,每50公斤主产品平均出售价格,每50公斤主产品总成本,每50公斤主产品净利润,每50公斤主产品现金成本,每50公斤主产品现金收益,每亩用工数量,每亩主产品出售数量,每亩主产品出售产值,商品率,每亩成本外支出,种子费,化肥费,农家肥费,农药费,农膜费,租赁作业费,燃料动力费,技术服务费,工具材料费,修理维护费,间接费用,家庭用工折价,雇工费用,每亩种子用量,每亩农膜用量,每亩化肥用量,每亩化肥金额。可选的,在所述采用Lasso回归模型筛选所述指数之前还包括:将所述指数进行归一化处理。根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:本专利技术公开了一种基于大数据的大豆生产的优化方法。获取影响大豆物质投入、费用投入和化肥投入的指标;去除所述指标中的多重共线性指标、数据缺失指标,获得筛选指标;根据所述筛选指标查询相对应的指数;将每种所述指数按列取累乘得到每一年相对首期的相对变化量;根据所述相对变化量计算涉及价格、成本、费用、利润和收入的投入量;采用Lasso回归模型筛选所述指数,获得压缩指数;根据所述压缩指数计算大豆品种在全国的投入单产。采用Lasso回归模型分析获得影响各类大豆单产各影响因素的量化情况,能够优化生产获得更加科学合理的大豆投入生产方式。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的基于大数据的大豆生产的优化方法的流程图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的目的是提供一种能够解决大数据分析过程中的过少的样本导致的过拟合问题的基于大数据的大豆生产的优化方法。为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。如图1所示,一种基于大数据的大豆生产的优化方法,所述优化方法包括:步骤100:获取影响大豆物质投入、费用投入和化肥投入的指标;步骤200:去除所述指标中的多重共线性指标、数据缺失指标,获得筛选指标;步骤300:根据所述筛选指标查询相对应的指数;步骤400:将每种所述指数按列取累乘得到每一年相对首期的相对变化量;步骤500:根据所述相对变化量计算涉及价格、成本、费用、利润和收入的投入量;步骤600:采用Lasso回归模型筛选所述指数,获得压缩指数;步骤700:根据所述压缩指数计算大豆品种在全国的投入单产。所述Lasso回归模型的函数为其中,w为回归方程的系数向量,X为所述指标,YI为观测值向量,α为自变量的系数,m为最优所述指标数目,N表示所述指标的总数,l1为正则项。可选的,所述根据所述压缩指数计算大豆品种在全国的投入单产具体包括:全国的投入单产其中,成本收益情况因素向量,费用和用工情况因素向量,为化学肥料投入因素向量,β1YI为成本收益情况因素对应的回归方程的系数向量,β2YI为费用和用工情况因素对应的回归方程的系数向量,β3YI为化学肥料投入因素对应的回归方程的系数向量。可选的,所述筛选指标具体指:每亩主产品产量,每亩产值合计,每亩总成本,每亩净利润,每亩现金成本,每亩现金收益,每50公斤主产品平均出售价格,每50公斤主产品总成本,每50公斤主产品净利润,每50公斤主产品现金成本,每50公斤主产品现金收益,每亩用工数量,每亩主产品出售数量,每亩主产品出售产值,商品率,每亩成本外支出,种子费,化肥费,农家肥费,农药费,农膜费,租赁作业费,燃料动力费,技术服务费,工具材料费,修理维护费,间接费用,家庭用工折价,雇工费用,每亩种子用量,每亩农膜用量,每亩化肥用量,每亩化肥金额。可选的,本文档来自技高网
...

【技术保护点】
1.一种基于大数据的大豆生产的优化方法,其特征在于,所述优化方法包括:获取影响大豆物质投入、费用投入和化肥投入的指标;去除所述指标中的多重共线性指标、数据缺失指标,获得筛选指标;根据所述筛选指标查询相对应的指数;将每种所述指数按列取累乘得到每一年相对首期的相对变化量;根据所述相对变化量计算涉及价格、成本、费用、利润和收入的投入量;采用Lasso回归模型筛选所述指数,获得压缩指数;根据所述压缩指数计算大豆品种在全国的投入单产。

【技术特征摘要】
1.一种基于大数据的大豆生产的优化方法,其特征在于,所述优化方法包括:获取影响大豆物质投入、费用投入和化肥投入的指标;去除所述指标中的多重共线性指标、数据缺失指标,获得筛选指标;根据所述筛选指标查询相对应的指数;将每种所述指数按列取累乘得到每一年相对首期的相对变化量;根据所述相对变化量计算涉及价格、成本、费用、利润和收入的投入量;采用Lasso回归模型筛选所述指数,获得压缩指数;根据所述压缩指数计算大豆品种在全国的投入单产。2.根据权利要求1所述的一种基于大数据的大豆生产的优化方法,其特征在于,所述Lasso回归模型的函数为其中,w为回归方程的系数向量,X为所述指标,YI为观测值向量,α为自变量的系数,m为最优所述指标数目,N表示所述指标的总数,l1为正则项。3.根据权利要求1所述的一种基于大数据的大豆生产的优化方法,其特征在于,所述根据所述压缩指数计算大豆品种在全国的投入单产具体包括:全国的投入单产其中,成本收益情况因素向量,费用和用工情况因素向量,为化学肥料投入因素向...

【专利技术属性】
技术研发人员:庄家煜许世卫李哲敏王禹
申请(专利权)人:中国农业科学院农业信息研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1