农业灾害预测方法技术

技术编号:6604096 阅读:241 留言:0更新日期:2012-04-11 18:40
本发明专利技术为一种农业灾害预测方法,包括步骤:S1,获取多源采集的多种属性的数据,并按照相应属性进行存储;S2,分别对各种属性的数据进行数据清洗,排除异常数据;S3,分别对各种属性的数据缺失值进行补充;S4,统一对各种属性的数据进行时间校准;S5,分别对各种属性的数据进行样本数据抽取,去除冗余数据提取精简数据集;S6,按照预定的预测模型进行数据预测;S7,进行预测精度检验,获得最终预测数据。本发明专利技术能够有效地保证数据质量的同时,提高数据采样速度和处理准确性从而提高了预测精度。

【技术实现步骤摘要】

本专利技术属于农业灾害预测
,特别涉及一种高预测精度的。
技术介绍
随着我国农业生产模式转型迫切要求和各类生产技术手段的提升,农业领域对于生产和安全可控要求的不断提高,对于农业自然灾害的各种预测方法和系统也不断出现。 系统开发的目标是决策与实施,预测是决策的前提与基础。预测的精度直接影响决策的目标和处方的质量,如何对农业各个决策环节进行预测,如何预测才能提高精度是农业工程研发的重点。预测的方法多种多样,每个预测方法都不可能完全包含预测目标的所有影响因子,鉴于在农业体系中预测目标的复杂性与多样性,对于影响因子属性数据的处理对预测精度显得更为重要。在各种预测方式中其中多以气象因素为响应属性值的灾害预测,而对于气象因素对农业生产影响的相关预测研究较少,预测精度不高。目前,在农业灾害预测领域对于数据处理和预测方法上,对于用于预测获取的数据根据实际应用情况可采用数据清理、数据集成、数据归约等处理技术。预测方法由于农业灾害的数值型和多变性应用,多采用多元线性回归、时间序列ARMA模型预测、BP神经网络预测等方法。但大多数预测方式中多未涉及对数据进行预先处理的操作,对于预测精度没有具体描述。即使是有描述的处理方法中也基本采用利用实测值与预测值之间的残差作为阈值因子进行异常值排除和曲线拟合。这种方式对于本身季节性和多变性的农业气象因素来说,存在过度拟合和预测偏离的问题。
技术实现思路
(一 )要解决的技术问题本专利技术的目的是为了针对以上问题和农业灾害预测中实际情况,本专利技术通过研究数据处理技术和预测模型,提出一种高精度的。( 二 )技术方案为了解决上述技术问题,本专利技术提供一种,包括步骤Si,获取多源采集的多种属性的数据,并按照相应属性进行存储;S2,分别对各种属性的数据进行数据清洗,排除异常数据;S3,分别对各种属性的数据缺失值进行补充;S4,统一对各种属性的数据进行时间校准;S5,分别对各种属性的数据进行样本数据抽取,去除冗余数据提取精简数据集;S6,按照预定的预测模型进行数据预测;S7,进行预测精度检验,获得最终预测数据。优选地,所述步骤S2中数据清洗的方法包括步骤S21,确定稳定态数据;322,根据所述稳定态数据生成相应属性数据的自增量偏差模型,所述自增量偏差 模型包含自增量偏差序列;523,以所述自增量偏差序列做正态性分布数据检验,获取所述自增量偏差序列的 标准差范围;524,根据所述自增量偏差序列的标准差范围进行控制图偏差检测,提取所要求的 精度范围,对后续数据进行检测,排除异常数据。优选地,所述步骤S3中补充数据缺失值的方法包括利用相应属性数据的自稳态偏差均值进行差分自校正,实现对数据缺失值的补 充。优选地,所述步骤S4中进行时间校准的方法包括采用内插外推时间配准方法,在同ー时间片内,对各属性的采集数据进行内插外 推,将高精度采集时间上的数据推算到低精度的采集时间点上,以达到各属性数据时间上 的同步。优选地,所述步骤S5中进行样本数据抽取的方法包括对于大数据量数据,根据数据同步后的数据进行自适应变距调整抽样样本数据, 抽取去除冗余数据提取精简数据集。优选地,所述步骤S6中得到预测模型的方法包括561,依据相关农业信息进行相关成分分析,进行数据集降维处理,得到数据预测 的主要属性;362,利用所述主要属性测量数据进行时间序列数据的模型预测,得到预测模型。优选地,所述步骤S7中预测精度检验方法包括利用预测属性和历史统计数据进行统计特性分析,依照精度比对指标,进行參照 对比,得到最终预测数据。(三)有益效果本专利技术提供了ー种提高数据预测精度的,采用对自变量数据进 行数据清洗,偏差检测,时间校准,样本抽取的序列数据处理方式,能够有效地保证数据质 量的同时,提高数据采样速度和处理准确性从而提高了预测精度。附图说明图1为本专利技术的流程图;图2为本专利技术ー实施例的预测模型属性定义图;图3为本专利技术ー实施例的属性自增量偏差序列的统计描述图;图4为本专利技术ー实施例的自增量偏差序列P_P图检验图;图5为本专利技术ー实施例的自增量偏差序列K-S检验统计图;图6为本专利技术ー实施例的控制图检验排除异常点示意图;图7为本专利技术ー实施例的样本抽样自适应变距调整示意图;图8为本专利技术ー实施例的预测属性相关性检验示意图;图9为本专利技术ー实施例的预测模型数据示意图;图10为本专利技术ー实施例的预测数据对比图。具体实施例方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不是限制本专利技术的范围。请参照图1,为本专利技术所述的流程图。本专利技术一实施例所提供的,主要是针对在自然条件下,对山东寿光地区采集数据进行测试检验,以下各实施例中预测选择同期历史数据以及2005-2010 年7月间此地区实测农田数据的气象和土壤干旱情况为例。如图1所示,本专利技术所述,包括Si,获取多源采集的多种属性的数据,并按照相应属性进行存储;该步骤可以具体包括a)获取多源传感器数据对干旱灾害预测中考虑到各种影响因子的检测和采集设备不同,异构设备较多,采集时间和精度前后都有差异;b)获取多源数据后将其按照对应属性存入如图2所述预处理数据表中。日照时数、空气温度、空气湿度、风速、降水量、水汽压气象因素为多源属性值。S2,分别对各种属性的数据进行数据清洗,排除异常数据;该步骤可以具体包括S21,确定稳定态数据;以温度属性为例,利用七月份稳定某日的测量稳定态数据, 即传感器采集数据对照手工采集数据校正获取的数据作为稳定态数据。S22,根据所述稳定态数据生成相应属性数据的自增量偏差模型,所述自增量偏差模型包含自增量偏差序列;定义属性值序列Y = {yt I yt e Rl,变量yt依赖于自变量t,当t 变到t+Ι时,因变量yt = y(t)的改变量Ay (t) = y (t+1)-y (t)称为变量y (t)在点t处步长为1(以5分钟作为步长1的基本单位)的自增量偏差,常记作Ayt = yw_yt,简称为函数y(t)的差分,并称Δ为差分算子。取Ayt作为自增量偏差序列{Ayt},记做X= {xj , 反应了属性值时序上变化。如图3所示本实施例中获得的一属性自增量偏差序列的统计描述。S23,以所述自增量偏差序列做正态性分布数据检验,获取所述自增量偏差序列的标准差范围;采用直方图、P-P检测图以及Kolmogorov-Smirnov检验算法等对序列做正态性检验,获取样本的标准差-S。如图4所示的P-P图满足累计概率符合正态分布。如图5 所示的K-S检验P值> 0. 5,偏度峰度值也说明正态分布性较好。说明序列服从正态分布, 可应用于自偏差检测。S24,根据所述自增量偏差序列的标准差范围进行控制图偏差检测,提取所要求的精度范围,对后续数据进行检测,排除异常数据;用控制图偏差检测挖掘的方法,用于检验离群值是否为异常数据。基于数理统计中的拉依达准则(即3S原则)如果离群值Xi与测定平均值卩的偏差的绝对值大于三倍标准偏差,即则认为Xi是异常值。这里我们获取得到了属性序列稳态下的自偏差阈值因子3S = 0. 4945。 那么我们就认为对于一般采集的属性序列值Y的自偏差序列值X存在某些xt+1 = (yt+1-yt) > 3S的数据,我们将t+1时刻的数^吣视作异常值剔本文档来自技高网...

【技术保护点】
1.一种农业灾害预测方法,其特征在于,包括步骤:S1,获取多源采集的多种属性的数据,并按照相应属性进行存储;S2,分别对各种属性的数据进行数据清洗,排除异常数据;S3,分别对各种属性的数据缺失值进行补充;S4,统一对各种属性的数据进行时间校准;S5,分别对各种属性的数据进行样本数据抽取,去除冗余数据提取精简数据集;S6,按照预定的预测模型进行数据预测;S7,进行预测精度检验,获得最终预测数据。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘刚王圣伟冯娟张帆
申请(专利权)人:中国农业大学
类型:发明
国别省市:11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1