当前位置: 首页 > 专利查询>湖北大学专利>正文

一种对土壤养分测试数据进行特异值处理的方法及系统技术方案

技术编号:17406763 阅读:135 留言:0更新日期:2018-03-07 04:42
本发明专利技术属于特异值处理技术领域,公开了一种对土壤养分测试数据进行特异值处理的方法及系统,所述对土壤养分测试数据进行特异值处理的方法为:利用邻近点数据比较法对土壤养分测试数据进行特异值处理;并对比分析了3σ准则、估计邻域法、影响系数法、邻近点数据比较法4种识别与处理特异值方法的优劣。结果表明,本发明专利技术的邻近点数据比较法对土壤养分测试数据进行特异值处理获得了较好的效果,对提高地质统计学研究结果的精度,有积极的作用。

A method and system for the specific value of soil nutrient test data

【技术实现步骤摘要】
一种对土壤养分测试数据进行特异值处理的方法及系统
本专利技术属于特异值处理
,尤其涉及一种对土壤养分测试数据进行特异值处理的方法及系统。
技术介绍
目前,基于区域化变量理论的地质统计学是研究既具有随机性又具结构性的自然现象的最好方法,特异值的存在却严重地影响了变异函数的计算,而变异函数计算的偏差无疑大大影响了地质统计学研究结果的最优无偏性及变异函数理论模型的精度,使得实验半方差函数发生畸变,甚至会掩盖变量固有的空间结构特征。在土壤养分时空变异的研究中发现,原始的实验数据往往呈“长尾巴”或偏态分布,主要原因是采样过程存在混合总体或特别是受特异值的影响。对于容量超过200的大样本,少数特异值仍可能歪曲统计样本的结果。为了降低这些因素的影响,对传统实验数据应进行特异值的分析和处理。途径之一为修改数据以适应方法,主要有3σ准则、估计邻域法和影响系数法。这些方法常用于地质统计学中,尚未在土壤养分空间变异中系统应用与考查。综上所述,现有技术存在的问题是:基于区域化变量理论的地质统计学中特异值的存在却严重地影响了变异函数的计算,使得实验半方差函数发生畸变,甚至会掩盖变量固有的空间结构特征;而现在特异值处理的方法单一,不能很好地提高地质统计学研究结果的精度;不能为农田土壤养分数据空间变异研究的最优处理方法提供指导意义。
技术实现思路
针对现有技术存在的问题,本专利技术提供一种对土壤养分测试数据进行特异值处理的方法及系统。本专利技术是这样实现的,一种对土壤养分测试数据进行特异值处理的方法,所述对土壤养分测试数据进行特异值处理的方法为:利用邻近点数据比较法对土壤养分测试数据进行特异值处理。具体方法:将常规统计特征与空间位置关系相结合,在判断样点数据是否可疑时,除了将该数据与ā加减三倍标准差进行比较外,还应该将该数据与周围邻近的8点的数据进行比较。如果该数据与总体数据比较值偏高,且与周围数据点比较也偏高,即该数据点数值偏高,而周围数据点数值较低,则该点为可疑点;如果该点与总体数据比较值偏低,且与周围数据点比较也偏低,即该数据点数值偏低,而周围数据点数值较高,则该点为可疑点;反过来,如果该数据与总体数据比较值偏高,而周围点也较高。该数据与总体数据比较偏低,而周围点也偏低,则该点不应去除。定义一个3×3矩阵,G为待估计值,在矩阵的中心,{x1,x2,…,xN}是周边8点的样本,为所有样本的平均值,S为样本的标准差,xnb为G点邻近点的值,snb=为G点邻近8点的标准差。判断条件:如果并且G点不是异常值,否则则为异常点,并用或者的值来替代异常值。例如:对于某个样点的土壤养分数据,如果比总体均值大3倍标准差或以上,同时比邻近8点的均值大3倍标准差或以上;或者比总体均值小3倍标准差或以上,同时比邻近3点的均值小3倍标准差或以上:则认为该点数据可疑,予以删除或者用邻近8点的平均值+3倍标准差替代。否则,则予以保留。进一步,将常规统计特征与空间位置关系相结合,在判断样点数据是否可疑时;将该数据与总体数据进行比较外,还将该数据与周围邻近的8点的数据进行比较;具体包括:对于某个样点的土壤养分数据,如果比总体均值大3倍标准差或以上,同时比邻近8点的均值大3倍标准差或以上;或者比总体均值小3倍标准差或以上,同时比邻近8点的均值小3倍标准差或以上:该点数据可疑,予以删除;否则,则予以保留。本专利技术的另一目的在与提供一种对土壤养分测试数据进行特异值处理系统。本专利技术的优点及积极效果为:本专利技术利用邻近点比较法进行特异值剔除,既可使各项数据更为稳健,又可以使得各指标数据有较好的空间变异函数拟合效果,所得结果较为理想,更有利于后序空间变异特征的分析工作。本专利技术方法即邻近点比较法与标准差法相比,从偏度、峰度和残差分别降低了23.6%、48.79%以及34.97%的误差,相关系数提高了8.1%。附图说明图1是本专利技术实施例提供的利用邻近点数据比较法对土壤养分测试数据进行特异值处理流程图。具体实施方式为能进一步了解本专利技术的
技术实现思路
、特点及功效,兹例举以下实施例,并配合附图详细说明如下。下面结合附图对本专利技术的结构作详细的描述。本专利技术实施例提供对土壤养分测试数据进行特异值处理的方法,利用邻近点数据比较法对土壤养分测试数据进行特异值处理。具体包括:S101:将常规统计特征与空间位置关系相结合,在判断样点数据是否可疑时,除了将该数据与ā加减三倍标准差进行比较外,还应该将该数据与周围邻近的8点的数据进行比较。S102:如果该数据与总体数据比较值偏高,且与周围数据点比较也偏高,即该数据点数值偏高,而周围数据点数值较低,则该点为可疑点;如果该点与总体数据比较值偏低,且与周围数据点比较也偏低,即该数据点数值偏低,而周围数据点数值较高,则该点为可疑点;反过来,如果该数据与总体数据比较值偏高,而周围点也较高。该数据与总体数据比较偏低,而周围点也偏低,则该点不应去除。利用邻近点数据比较法对土壤养分测试数据进行特异值处理中,定义一个3×3矩阵,,G为待估计值,在矩阵的中心,{x1,x2,…,xN}是周边8点的样本,为所有样本的平均值,S为样本的标准差,判断条件:如果并且G点不是异常值,否则则为异常点,并用或者的值来替代异常值。其中,S为样本的标准差中,xnb为G点邻近点的值,snb=为G点邻近8点的标准差。下面结合具体实施例对本专利技术作进一步描述。1材料与方法1.1分析区基本情况分析区在贵州省平坝县马场镇栗木村。海拔1240m,平均温14.1℃,无霜期268~288d,年平均降雨量1298mm;耕地面积占土地总面积的15%左右,水田与旱地各占耕地面积的50%左右;土壤类型为黄壤性水稻土和黄壤旱地,典型的山原地貌,碳酸盐岩广布。该地气候特征、地貌特征代表着黔中一带的广大地区。1.2土壤样品采集与分析土壤样品采用GPS定位按50m×50m的网格进行定点取样,于冬季作物种植前采取土壤样品353个,取样深度为0~20cm。土壤样品由中国农业科学院土壤肥料研究所北京中一一加合作实验室采用国际农化服务中心推荐的ASI法分析,包括土壤pH、OM、NH4+-N、有效磷、有效钾、Ca、Mg、B、S、Cu、Fe、Mn、Zn在内的13项土壤测试数据如表1。表1土壤养分数据基本统计特征值1.3数据处理采用传统统计学和地统计学相结合的方法进行数据处理,通过3σ准则、估计邻域法、影响系数法、邻近点数据比较法4种识别与处理特异值方法剔除、检验处理后,以GS+forWindows3.1进行偏度、峰度值、半方差函数及其模型计算拟合,以Sufer8.0做Kriging插值。2特异值的识别与处理方法2.13σ准则3σ准则识别特异值,即样本平均值ā加减三倍标准差s,在区间(ā±3σ)以外的数据均定为特异值,然后分别用正常最大和正常最小值代替特异值。2.2估计邻域法(ENM)该法是D、G克立格及D、M霍金斯把地质统计的基本思想用于识别及处理特异值的方法。识别特异值的统计量I计算式为:I服从自由度为1和∞的F分布,当I>3.84时,可疑值G被确定为特异值,即表示在95%的置信区间的基础上确定G为特异值;m为不包含G的邻域内其它样品观测值的算术平均值;n为不包含G的邻域内的样品数;σ2为邻域内观测值的平均方差。在识别出本文档来自技高网
...
一种对土壤养分测试数据进行特异值处理的方法及系统

【技术保护点】
一种对土壤养分测试数据进行特异值处理的方法,其特征在于,所述对土壤养分测试数据进行特异值处理的方法为:利用邻近点数据比较法对土壤养分测试数据进行特异值处理。

【技术特征摘要】
1.一种对土壤养分测试数据进行特异值处理的方法,其特征在于,所述对土壤养分测试数据进行特异值处理的方法为:利用邻近点数据比较法对土壤养分测试数据进行特异值处理。2.如权利要求1所述的对土壤养分测试数据进行特异值处理的方法,其特征在于,所述利用邻近点数据比较法,具体包括:将常规统计特征与空间位置关系相结合,在判断样点数据是否可疑时,除将样点数据与加减三倍标准差进行比较外,还将该样点数据与周围邻近的8点的数据进行比较;定义一个3×3矩阵,G为待估计值,在矩阵的中心,{x1,x2,…,xN}是周边8点的...

【专利技术属性】
技术研发人员:李中元
申请(专利权)人:湖北大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1