一种原位识别农产品重金属含量潜在超标区域的方法及装置制造方法及图纸

技术编号:27313603 阅读:24 留言:0更新日期:2021-02-10 09:41
本案涉及一种原位识别农产品重金属含量潜在超标区域的方法及装置,包括:(1)区域定位及背景参数获取,(2)土壤数据快速采集,(3)数据扩增及超标概率预测,(4)潜在超标区域识别,解决了现有正例、负例样本量不均衡的问题,超标概率预测模型准确率、召回率和F1分别提升23%、25%、13%,特别是对于正负例样本量差距超过3倍的区域,其他模型F1趋近于0,无法使用,而本申请所采用模型可将F1提升到0.4左右。而本申请所采用模型可将F1提升到0.4左右。而本申请所采用模型可将F1提升到0.4左右。

【技术实现步骤摘要】
一种原位识别农产品重金属含量潜在超标区域的方法及装置


[0001]本专利技术属于农业环境
,具体涉及一种原位识别农产品重金属含量潜在超标区域的方法及装置

技术介绍

[0002]农产品重金属污染严重威胁人民群众身体健康,为尽早掌握农产品重金属含量超标风险,识别潜在超标区域,及时实施相应的风险管控措施,提出了多种利用土壤重金属含量和相关理化性质预测农产品重金属超标概率的技术方法,主要包括规则类的逻辑回归、决策树,分布类的二次判别、朴素贝叶斯,网络类的BP神经网络、向量机等方法。
[0003]上述技术方法存在的主要问题有:(1)需要使用的土壤监测数据获取时间较长、成本较高,一般情况下,至少需要一个月的时间才能得到所需要的全部数据,而此时,对于大多数要求在种植前和苗期施用的风险管控措施均已无法应用;(2)对于超标率过高或过低的区域,由于超标样本和未超标样本在数量上的不均衡,导致预测模型崩溃极易发生,特别是考虑到我国农产品重金属超标率总体不超过10%的实际,这种限制可能出现的极为普遍。有鉴于此,有必要提出一种能够快速、高效原位识别农产品重金属含量潜在超标区域的方法及装置。

技术实现思路

[0004]本专利技术的目的是提供一种原位识别农产品重金属含量潜在超标区域的方法及装置。
[0005]为了解决上述技术问题,本专利技术公开了一种原位识别农产品重金属含量潜在超标区域的方法,所述方法包括:
[0006](1)区域定位及背景参数获取:调取待识别区域的背景信息;
[0007](2)土壤数据快速采集:
[0008](a)依据待识别区域面积,采取均匀布点法计算区域内点位数量,计算公式为:
[0009][0010]其中,N为点位数量,A为待识别区域面积(亩),当计算结果为小数时,N值向上取整,
[0011]然后采取均匀部件方式布设土壤点位;
[0012](b)土壤样品采用样品盒装载后置于样品池内,经X荧光快速检测光路系统进行检测;
[0013](c)获取采样点坐标信息与检测结果点位信息;
[0014](3)数据扩增及超标概率预测:获取土壤地理信息、监测指标、环境信息、检测结果,通过模型扩增农产品数据并进行农产品超标概率预测;
[0015](4)潜在超标区域识别:选用等高线法,以农产品超标概率范围将待识别区域划分区域;
[0016]优选的是,所述检测指标包括Cd、As、Pb、Cr、Cu、Zn、Ni、Mg、Fe、Mn、Ca、Si、Se含量中的一种或多种;
[0017]优选的是,所述背景信息获取包括区域边界、行政区划、土壤类型、土地利用方式、作物类型、历史监测点位、农产品检测值中的一种或多种;
[0018]优选的是,所述背景信息还包括设置任务编号、任务名称、任务位置、待识别区域中心坐标、待识别区域四至坐标及任务时间;
[0019]优选的是,步骤(3)数据扩增及超标概率预测的具体步骤为:
[0020](3.1)以国家标准GB2762为标准,将数据集中的超标数据作为正例,所述正例的数据量为N1,不超标数据作为负例,所述负例的数据量为N2,二者差值的绝对值为需要模拟生成的数据量M;
[0021](3.2)随机生成M个k维模拟数据,同时选择M个真实数据,所述M个真实数据中同时包含正例和负例,正例、负例数量比例为N1/N2,
[0022]建立神经判别网络模型D,隐含层数量为2-4层,所述神经网络模型判别模型D的信息反馈函数为:
[0023]V(D)=E[D(G(z))]+E[log(1-D(G(z)))][0024]其中,z表示训练数据;E表示关于z的计算期望函数,G为生成神经网络模型、D为判别神经网络模型;
[0025]利用判别神经判别网络模型D将上述随机生成的M个模拟数据和M个真实数据作为输入,训练模型直至实现全部模拟数据输出为<0.5、真实数据输出为≥0.5,训练条件是不断调整模型参数,使神经判别网络模型D的信息反馈函数输出值的变化梯度不断减少,直至低于0.001,获取训练好的神经判别网络模型D;
[0026](3.3)建立生成神经网络模型G,隐含层数量为2-4层,所述生成神经网络模型G的信息反馈函数为:
[0027][0028]其中,为原始的生成数据的先验概率
[0029]以M/2个k维随机模拟数据为输入,利用生成神经网络模型G生成M个模拟数据,并将生产的M个模拟数据输入进训练好的神经判别网络模型D中,不断训练生成神经网络模型G直至全部利用生成神经网络模型G生成的模拟数据在训练好的神经判别网络模型D的输出中均识别为≥0.5;
[0030]训练条件是不断调整生成神经网络模型G的参数,使所述生成神经网络模型G的信息反馈函数输出值的变化梯度不断减少,直至低于0.001,得到调整后的生成神经网络模型G;
[0031](3.4)在不改动所述调整后的生成神经网络模型G的参数的前提下,重复(3.2)的操作,直至全部模拟数据输出为<0.5、真实数据输出为≥0.5,获取更新后的神经判别网络模型D,然后,在不改动神经判别网络模型D的前提下,重复(3.3)的操作,直至全部利用生成神经网络模型G生成的模拟数据在更新后的神经判别网络模型D的输出中均识别为≥0.5,最终获取训练好的生成神经网络模型G;
[0032](3.5)向所述训练好的生成神经网络模型G输入N个k维数据,其中N>M,利用训练好
的生成神经网络模型G生成M个k维模拟的正例或负例数据,按照以下公式计算Pi:
[0033][0034]其中,为生成数据的先验概率,μ为均值向量,∑为协方差矩阵;
[0035][0036]其中,A是历史数据中真实正例的比例,而B是历史数据中真实负例的比例。
[0037](3.6)上述(3.5)的模型结果Pi在i=0时代表农产品不超标概率,i=1代表农产品超标概率,农产品超标概率P按照以下公式计算:
[0038][0039]优选的是,所述步骤(3.4)迭代5000-8000次;
[0040]优选的是,所述数据集为k维数据,k为需要纳入超标概率预测模型的参数数量;
[0041]优选的是,所述模型参数包括但不限于隐含层数量、输入数据量、数据维度等;
[0042]一种原位识别农产品重金属含量潜在超标区域的装置,所述装置包括控制面板(1)、GPS定位模块(2)、样品盒(3)、样品池(4)、荧光快速检测光路系统(5)、数值运算及空间分析模块(6)、存储模块(7)、电源模块(8)及功能键(9),执行任务的用户通过所述控制面板(1)点选相应任务信息,链接后台数据库,调取待识别区域的背景信息,并下载保存至存储模块(7),所述后台数据库中的背景信息包括但不限于区域边界、行政区划、土壤类型、土地利用方式、作物类型、历史监测点位土壤数据、历史监测点位农产品监测结果,所述GPS定位模块(2)用于获取土壤点位地理信息,所述样品本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种原位识别农产品重金属含量潜在超标区域的方法,其特征在于,所述方法包括:(1)区域定位及背景参数获取:调取待识别区域的背景信息;(2)土壤数据快速采集:(2.1)依据待识别区域面积,采取均匀布点法计算区域内点位数量,计算公式为:其中,N为点位数量,A为待识别区域面积(亩),当计算结果为小数时,N值向上取整,然后采取均匀布点方式布设土壤点位;(2.2)土壤样品采用样品盒装载后置于样品池内,经X荧光快速检测光路系统进行检测;(2.3)获取采样点坐标信息与检测结果点位信息;(3)数据扩增及超标概率预测:获取土壤地理信息、监测指标、环境信息、检测结果,通过模型扩增农产品数据并进行农产品超标概率预测;(4)潜在超标区域识别:选用等高线法,以农产品超标概率范围将待识别区域划分区域。2.如权利要求1所述的原位识别农产品重金属含量潜在超标区域的方法,其特征在于,所述检测指标包括Cd、As、Pb、Cr、Cu、Zn、Ni、Mg、Fe、Mn、Ca、Si、Se含量中的一种或多种。3.如权利要求1所述的原位识别农产品重金属含量潜在超标区域的方法,其特征在于,所述背景信息获取包括区域边界、行政区划、土壤类型、土地利用方式、作物类型、历史监测点位、农产品检测值中的一种或多种。4.如权利要求3所述的原位识别农产品重金属含量潜在超标区域的方法,其特征在于,所述背景信息还包括设置任务编号、任务名称、任务位置、待识别区域中心坐标、待识别区域四至坐标及任务时间。5.如权利要求1所述的原位识别农产品重金属含量潜在超标区域的方法,其特征在于,步骤(3)数据扩增及超标概率预测的具体步骤为:(3.1)以国家标准GB2762为标准,将数据集中的超标数据作为正例,所述正例的数据量为N1,不超标数据作为负例,所述负例的数据量为N2,二者差值的绝对值为需要模拟生成的数据量M;(3.2)随机生成M个k维模拟数据,同时选择M个真实数据,所述M个真实数据中同时包含正例和负例,正例、负例数量比例为N1/N2,建立神经判别网络模型D,隐含层数量为2-4层,所述神经网络模型判别模型D的信息反馈函数为:其中,z表示训练数据;E表示关于z的计算期望函数,G为生成神经网络模型,D为判别神经网络模型;利用判别神经网络模型D将上述随机生成的M个模拟数据和M个真实数据作为输入,训练模型直至实现全部模拟数据输出为<0.5、真实数据输出为≥0.5,训练条件是不断调整模型参数,使判别神经网络模型D的信息反馈函数输出值的变化梯度不断减少,直至低于
0.001,获取训练好的判别神经网络模型D;(3.3)建立生成神经网络模型G,隐含层数量为2-4层,所述生成神经网络模型G的信息反馈函数为:其中,为原始的生成数据的先验概率以M/2个k维随机模拟数据为输入,利用生成神经网络模型G生成M个模拟数据,并将生产的M个模拟数据输入进训练好的判别神经网络模...

【专利技术属性】
技术研发人员:安毅霍莉莉武丽娜林大松秦莉杜兆林姚彦坡丁健
申请(专利权)人:农业农村部环境保护科研监测所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1