当前位置: 首页 > 专利查询>中国电建集团贵阳勘测设计研究院有限公司专利>正文

一种空间数据属性补全方法技术

技术编号：38994532 阅读：13 留言：0更新日期：2023-10-07 10:25

一种空间数据属性补全方法，包括以下步骤：S1、数据准备；S2、获取本期空间数据的内部点；S3、空间关联：将步骤S2中获取的本期空间数据的内部点与上一期空间数据进行空间关联，有空间位置重叠的记录为1，无空间位置重叠的记录为0；分别获得第一次数据补全结果和第二次数据补全结果；S4、补全结果合并。本发明专利技术根据长时间序列空间数据中的两期数据空间位置重叠，快速地实现空间数据属性初次补全工作，然后再对无空间位置重叠的待补全数据分析其与上一期数据邻近关系，设置邻近参考上一期要素个数，生成空间位置邻近关联表，经分析核实后确定补全内容，最后合并生成最终补全数据，为空间数据管理分析和应用提供准确数据支撑。间数据管理分析和应用提供准确数据支撑。间数据管理分析和应用提供准确数据支撑。

全部详细技术资料下载

【技术实现步骤摘要】
一种空间数据属性补全方法

[0001]本专利技术涉及空间数据处理
，尤其涉及一种空间数据属性补全方法。

技术介绍

[0002]数据缺失是各研究领域一个很常见的问题，因诸多因素的不确定性，导致这种现象在现实生活中难以避免，同时，基础数据质量决定着研究成果准确与否，为了给科学研究提供准确的基础数据，开展数据缺失值的分析与研究非常具有理论和现实意义。多年来，对于数据缺失值补全的方法研究一直以来都是学者们研究的热门方向。2021年，徐文权通过对交通数据的挖掘，提取路网的空间特征和流量数据的时间特征，同时还捕获了不同类型数据之间的相关性信息，对缺失的数据进行有效的恢复，为智能交通系统中基于交通数据的应用提供有效的数据完整性支撑。2022年，杨哲通过实验对GAN
‑
TRTI模型和均值填充法、KNN填充法、缺失森林填充法等方法进行了对比分析，实验表明GAN
‑
TRTI模型具有更好的填充性能。2023年周楚昊等提出了一种基于自监督学习的用于高速公路交通流量数据缺失补全的方法，该方法采用了基于注意力机制的时间序列模型(Seq2Seq
‑
Att)；然后使用自监督学习方式对模型进行训练；最后，以广东省高速公路网的80个收费站为例，验证方法的可靠性。现阶段，数据补全方法常用机器学习方法，其需要大量训练样本，前期样本标记需要耗费大量人力物力，样本决定模型精度和适用性。
[0003]目前，空间数据缺失值主要从空间关联性、时间关联性和时空关联性分析后进行补全。大多数学者都采用同时...

【技术保护点】

【技术特征摘要】
1.一种空间数据属性补全方法，其特征在于，包括以下步骤：S1、数据准备：所述数据包括空间位置重叠本期空间数据和上一期空间数据，其中本期数据为待补全数据；S2、获取本期空间数据的内部点：计算本期空间数据中各要素栅格单元尺寸，将其要素栅格化，统计每个要素栅格化单元数量，计算出栅格单元数量的中位数，提取中位数栅格单元，并将其中心点位置转换为点要素作为本期要素内部点；S3、空间关联：将步骤S2中获取的本期空间数据的内部点与上一期空间数据进行空间关联，有空间位置重叠的记录为1，无空间位置重叠的记录为0；对于存在空间位置重叠的内部点，直接继承上一期空间数据属性值，完成对本期空间位置重叠的内部点的属性值补全，将内部点属性挂接到本期空间数据上，获得第一次数据补全结果；对于无空间位置重叠的内部点，分别读取记录本期空间数据和上一期空间数据内各要素结点集合和标识码，设置本期要素需要参照邻近上一期要素的个数N，通过距离公式，采用遍历方式，分别计算出本期要素与上一期各要素最小距离值，通过升序排序，保留前N条记录，循环上述遍历步骤获得本期要素邻近上一期要素集合，分别挂接本期要素和上一期要素属性表，删除类别不一致记录行，对余下记录进行核对补全，获得第二次数据补全结果；S4、补全结果合并：将步骤S3中获得的第一次数据补全结果与第二次数据补全结果进行合并，得到最终空间数据属性补全结果。2.如权利要求1所述的一种空间数据属性补全方法，其特征在于，在步骤S2中，计算本期空间数据中各要素栅格单元尺寸时，单独计算各要素栅格化单元尺寸，栅格单元尺寸采用以下公式进行计算：CellSize＝INT((sqr(TBMJ)
‑
1)/2)，其中：TBMJ为要素的面积；在步骤S2中，对数据进行栅格化后统计栅格单元标识码频数，当存在频数与本期要素总数不一致时，筛选出未被栅格化要素，调整栅格单元尺寸，调整数为原来栅格单元尺寸的一半再次进行栅格化，获得本期栅格数据。3.如权利要求1所述的一种空间数据属性补全方法，其特征在于，在步骤S2中，在进行栅格化时，采用扫描线种子点填充算法实现矢量数据栅格化，包括如下步骤：S201、选择一个种子点Seed(x，y)，并将其存入栈内；S202、若栈已空，算法结束，否则执行步骤S203；S203、从栈中取出要填色的像素，对在同一扫描线上与该点相连的所有需要填色的点进行填色操作，记下进行填色的最左位置Xleft和最右位置Xright；S204、对步骤S203的上一行和下一行扫描，在Xleft≤x≤Xright范围内，考察是否全是边界点或已被填色的点，若不完全是，则将要填色的每一段最右位置作为新的种子点存入栈；S205、返回步骤S202。4.如权利要求3所述的一种空间数据属性补全方法，其特征在于，在步骤S2中，在计算栅格单元数量的中位数时，以每个栅格为单位，按照栅格单元中心矢量化为点要素的方式，每个栅格单元矢量化后形成的一个点，其计算公式如下：x＝x0+(J
‑
0.5)*D
x
y＝y0+(I
‑
0.5)*D
y
其中：x0，y0为左上角原点坐标，D
x
，D
y
...

【专利技术属性】
技术研发人员：王小标，徐鹏，苟胜国，曾飞翔，黎杰，邵瀚，
申请(专利权)人：中国电建集团贵阳勘测设计研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人