【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种采样点属性特征代表性度量方法及其装置。
技术介绍
1、空间采样是调查土壤属性空间变异和空间制图的基础。采样点的空间均匀分布和属性特征代表性是评价采样点数据质量的关键参数,也分别是采样点地理空间和特征空间的重要优化目标。采样点属性特征代表性是指所选采样点的属性特征(如环境参数、物理化学特性等)能够反映研究目标区域或目标总体的整体特征或分布规律,关键在于采样点与总体之间在属性特征上的一致性。在对采样点数据进行分析应用之前,必须先对采样点数据进行属性特征代表性度量,用于检测评价采样点的数据质量。根据采样点数据质量评价结果对低代表性的采样点进行相应数据精化处理,不仅可以降低采样点数据后续分析过程中的不确定性,还能保证采样点数据实际应用的准确性和可靠性。
2、采样点的属性特征代表性越高,说明采样点所反映的土壤属性空间分布规律越能够体现研究区土壤属性的整体分布规律。在数值空间内,属性特征代表性高的采样点,其土壤属性值应尽可能包含研究区土壤属性的典型值,同时采样点属性的值域范围与研究区土壤属性的值域范围一致性高。
3、目前,在采样点属性特征代表性度量过程中存在以下问题:
4、一是没有进行采样点属性特征代表性度量而直接进行数据分析应用。这样可能会出现部分采样点属性特征代表性差的情景,增加了数据分析过程中的不确定性,影响了采样点数据分析结果的精度和准确度。
5、二是基于环境条件的相似程度来度量代表程度构建的样点个体代表性。这一指标从环境相似性角度来间接体现采样点代
技术实现思路
1、本专利技术提供一种采样点属性特征代表性度量方法及其装置,进行采样点属性特征代表性度量,用于评价采样点数据质量,可以降低采样点在数据分析过程中的不确定性,保证采样点数据挖掘、分析的准确性和可靠性。
2、本专利技术提供一种采样点属性特征代表性度量方法,包括如下步骤:
3、基于目标属性确定采样区域内需进行属性特征代表性度量的目标采样点,所述目标属性是根据研究目标确定的;
4、确定与所述目标属性相关联的辅助属性,以获取各目标采样点的辅助属性数据构建辅助属性数据集;
5、确定每个所述目标采样点所在的泰森多边形作为对其进行属性特征代表性度量的度量单元;
6、将所述辅助属性数据集与所有所述度量单元进行空间叠置分析,确定每个所述度量单元内各辅助属性的属性类别数比例以及所述目标采样点在所属度量单元内各辅助属性的类别图斑面积比例;
7、所述属性类别数比例是基于度量单元内各辅助属性的类别数与所述采样区域内的同一辅助属性的类别总数确定的;所述类别图斑面积比例是基于目标采样点在所属度量单元内的具体类别所对应的类别图斑面积,以及所属度量单元内所述具体类别的类别图斑总面积确定的;
8、综合每个所述度量单元内各辅助属性的属性类别数比例、各目标采样点在所属度量单元内各辅助属性的类别图斑面积比例,以及各辅助属性的属性权重,确定每个所述目标采样点的属性特征代表性度量值。
9、根据本专利技术提供的一种采样点属性特征代表性度量方法,将所述辅助属性数据集与所有所述度量单元进行空间叠置分析,确定每个所述度量单元内各辅助属性的属性类别数比例以及所述目标采样点在所属度量单元内各辅助属性的类别图斑面积比例,包括:
10、将所述辅助属性数据集中的每个辅助属性作为独立图层生成对应的辅助属性数据图层;
11、将每个所述辅助属性数据图层与度量单元图层进行空间叠置分析,获取各度量单元内第 i种辅助属性的类别数和第 i种辅助属性中每个类别的类别图斑总面积;所述度量单元图层是由所有所述目标采样点的度量单元组成的;
12、根据各度量单元内所述第 i种辅助属性的类别数与所述采样区域内第 i种辅助属性的类别总数之间的第一比值,得到每个所述度量单元内第 i种辅助属性的所述属性类别数比例;
13、根据所述目标采样点在所属度量单元内的空间位置处的辅助属性的具体类别,确定所述度量单元内所述目标采样点的所述具体类别所在的类别图斑面积,以及所述度量单元内所述具体类别对应的类别图斑总面积;
14、根据所述类别图斑面积和所述类别图斑总面积之间的第二比值,确定所述类别图斑面积比例;
15、其中, i为正整数。
16、根据本专利技术提供的一种采样点属性特征代表性度量方法,在将所述辅助属性数据集中的每个辅助属性作为独立图层生成对应的辅助属性数据图层之前,还包括:
17、根据连续型属性数据的空间分布特征,将所述辅助属性数据集中的每个所述连续型属性数据重分类为类别型属性数据。
18、根据本专利技术提供的一种采样点属性特征代表性度量方法,所述综合每个所述度量单元内各辅助属性的属性类别数比例、各目标采样点在所属度量单元内各辅助属性的类别图斑面积比例,以及各辅助属性的属性权重,确定每个所述目标采样点的属性特征代表性度量值的数学计算模型为:
19、;
20、其中,为目标采样点y的属性特征代表性度量值,为目标采样点y所在度量单元内第 i种辅助属性的类别数;为采样区域内第 i种辅助属性的类别总数; n为辅助属性数据集中辅助属性的数量;为目标采样点y在所属度量单元内第 i种辅助属性的类别图斑面积比例;为第 i种辅助属性对应的属性权重。
21、根据本专利技术提供的一种采样点属性特征代表性度量方法,所述确定与所述目标属性相关联的辅助属性,包括:
22、确定候选辅助属性集合,所述候选辅助属性集合中包括多个连续型属性和多个类别型属性;
23、分别计算每个所述连续型属性与所述目标属性之间的相关系数,并根据所述相关系数的绝对值由大到小挑选预设数量的连续型属性作为连续型辅助属性;
24、将每个类别型属性设置为自变量,将所述目标属性设置为因变量,执行方差分析得到每个类别型属性的显著性概率值,将所述显著性概率值小于预设临界阈值的类别型属性作为类别型辅助属性。
25、根据本专利技术提供的一种采样点属性特征代表性度量方法,各辅助属性的属性权重是基于分类主成分分析方法计算得到的,具体包括:
26、对所述辅助属性数据集进行分类主成分分析,生成主成分载荷矩阵和特征值;
27、确定所有主成分中所述特征值大于1的主成分作为有效主成分,以从所述主成本文档来自技高网...
【技术保护点】
1.一种采样点属性特征代表性度量方法,其特征在于,包括:
2.根据权利要求1所述的采样点属性特征代表性度量方法,其特征在于,将所述辅助属性数据集与所有所述度量单元进行空间叠置分析,确定每个所述度量单元内各辅助属性的属性类别数比例以及所述目标采样点在所属度量单元内各辅助属性的类别图斑面积比例,包括:
3.根据权利要求2所述的采样点属性特征代表性度量方法,其特征在于,在将所述辅助属性数据集中的每个辅助属性作为独立图层生成对应的辅助属性数据图层之前,还包括:
4.根据权利要求1所述的采样点属性特征代表性度量方法,其特征在于,所述综合每个所述度量单元内各辅助属性的属性类别数比例、各目标采样点在所属度量单元内各辅助属性的类别图斑面积比例,以及各辅助属性的属性权重,确定每个所述目标采样点的属性特征代表性度量值的数学计算模型为:
5.根据权利要求1所述的采样点属性特征代表性度量方法,其特征在于,所述确定与所述目标属性相关联的辅助属性,包括:
6.根据权利要求1-5任一项所述的采样点属性特征代表性度量方法,其特征在于,各辅助属性的属性权
7.根据权利要求6所述的采样点属性特征代表性度量方法,其特征在于,用于计算所述公因子方差的数学计算模型为:
8.根据权利要求6所述的采样点属性特征代表性度量方法,其特征在于,所述基于每个辅助属性的公因子方差,确定每个辅助属性的所述属性权重,包括:
9.一种采样点属性特征代表性度量装置,其特征在于,包括:
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述采样点属性特征代表性度量方法。
11.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述采样点属性特征代表性度量方法。
12.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述采样点属性特征代表性度量方法。
...【技术特征摘要】
1.一种采样点属性特征代表性度量方法,其特征在于,包括:
2.根据权利要求1所述的采样点属性特征代表性度量方法,其特征在于,将所述辅助属性数据集与所有所述度量单元进行空间叠置分析,确定每个所述度量单元内各辅助属性的属性类别数比例以及所述目标采样点在所属度量单元内各辅助属性的类别图斑面积比例,包括:
3.根据权利要求2所述的采样点属性特征代表性度量方法,其特征在于,在将所述辅助属性数据集中的每个辅助属性作为独立图层生成对应的辅助属性数据图层之前,还包括:
4.根据权利要求1所述的采样点属性特征代表性度量方法,其特征在于,所述综合每个所述度量单元内各辅助属性的属性类别数比例、各目标采样点在所属度量单元内各辅助属性的类别图斑面积比例,以及各辅助属性的属性权重,确定每个所述目标采样点的属性特征代表性度量值的数学计算模型为:
5.根据权利要求1所述的采样点属性特征代表性度量方法,其特征在于,所述确定与所述目标属性相关联的辅助属性,包括:
6.根据权利要求1-5任一项所述的采样点属性特征代表性度量方法...
【专利技术属性】
技术研发人员:董士伟,刘玉,潘瑜春,孟凤,卢闯,单东方,
申请(专利权)人:北京市农林科学院信息技术研究中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。