System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于数据融合,具体涉及一种基于机器学习的空间数据融合方法、装置及存储介质。
技术介绍
1、空间数据融合涉及到地理信息、机器学习等多领域技术,在融合多源空间数据时,数据的质量和一致性问题显然是一个极具挑战性的方面。不同的数据源往往具备各自独特的特性,例如精度、分辨率以及标准化水平上存在显著的差异。这些差异可能导致融合后的数据存在不一致性和潜在误差,进而对最终的融合结果产生负面影响。不同数据源之间的精度差异可能会引入误差,因为一些数据源可能更准确地测量地理信息,而其他数据源可能存在测量误差或精度下降。这样的差异可能在融合过程中导致不匹配的问题,因为低精度数据可能会对高精度数据的融合结果产生显著影响。其次,数据分辨率的不同也是一个挑战。高分辨率数据源可以提供更详细的地理信息,而低分辨率数据源则可能丢失细节。在融合时,如何有效地处理这些不同分辨率数据,以保留重要信息并减少失真是一个复杂的问题,不同数据源的标准化级别可能存在差异,这需要在融合之前进行坐标转换或标准化处理,以确保数据在相同的地理坐标系下对齐。
2、总之,解决多源空间数据融合中的数据质量和一致性问题至关重要。这需要细致的数据预处理、标准化、坐标转换和质量控制步骤,以确保融合后的数据集在各个方面保持一致性,并减小由于数据差异引起的误差,从而提高了融合结果的可靠性和准确性。
3、多源异构数据融合在空间数据领域的作用显著,它能够整合来自卫星遥感、地理信息系统、传感器网络等多个来源的地理信息数据,提供更全面、准确、多维度的地理数据,从而支持广泛的应用
技术实现思路
1、本专利技术针对上述问题,提供了一种基于机器学习的空间数据融合方法、装置及存储介质,通过对多源异构数据进行数据预处理,采用基于密度的空间聚类方法,融合后生成新的数据样本集。
2、根据本公开实施例的第一方面,提供一种基于机器学习的空间数据融合方法,所述方法包括以下步骤:
3、对接收到的原始多源异构空间数据进行标注;
4、根据标注提取原始多源异构空间数据中的地理位置信息和特征信息,生成训练数据样本;
5、对所述训练数据样本进行基于密度的聚类分析,得到聚类后空间数据;
6、利用所述聚类后空间数据访问各所述训练数据样本,获取同一分类下数据样本标记簇编号clusternum,得到带有clusternum的数据集。
7、在一实施例中,在对接收到的原始多源异构空间数据进行标注前,先对原始多源异构空间数据进行预处理,具体包括:
8、对原始多源异构空间数据进行清洗:对数据缺失部分进行平均值填充,对数据重复部分进行删除,对数据异样部分进行标记;对清洗后的数据使用标准差进行数据标准化。
9、在一实施例中,所述对接收到的原始多源异构空间数据进行标注,具体包括将原始多源异构空间数据中的非结构化数据转为结构化数据,即将各所述非结构化数据用所有非结构化数据的平均值替代。
10、在一实施例中,所述对所述训练数据样本进行基于密度的聚类分析,得到分类后空间数据,具体包括:
11、步骤1,根据所述训练数据样本集合s={x1,x2,…,xn},获取基于密度的聚类分析方法的邻域参数{eps,minpts},其中,eps和minpts分别表示半径和最小样本数;
12、步骤2,初始化核心点集合、聚类簇数和访问样本集合;
13、步骤3,对于i=1,2,…,n,通过距离度量方法,找到样本xi的邻域子样本集合n∈(xi);若子样本集合样本个体数满足|n∈(xi)|≥minpts,将样本xi加入核心点集合ω=ω∪{xi};其中核心点表示如果指定半径ε内的数据点数量超过了规定的最小样本数minpts,该点即称为核心点;
14、步骤4,如果核心点集合则结束算法,否则转入步骤5;
15、步骤5,在核心点集合ω中,随机选择一个核心点p,初始化当前簇核心点队列ωcur={p},初始化列别序号k=k+1,初始化当前簇样本集合ck={p},更新为访问样本集合v=v-{p};
16、步骤6,如果当前簇核心点队列当前簇ck生成完毕,更新簇划分c={c1,c2,…,ck},更新核心点集合ω=ω-ck,转入步骤4,否则更新簇划分c={c1,c2,…,ck};
17、步骤7,在ωcur中取出核心点p′,找出所有的eps邻域子样本集合n∈(p′),更新当前簇样本集合为ck=ck∪n∈(p′)∩v,更新访问样本集合v=v-n∈(p′)∩v,更新ωcur=ωcur∪(n∈(p′)∩v)∩ω-{p′},转入步骤6;
18、步骤8,遍历所有样本点,直到所有样本均被访问,簇划分为c={c1,c2,…,ck}。
19、在一实施例中,所述步骤1中确定邻域参数{eps,minpts}的方法具体包括:
20、根据输入样本数据,选取k-distance函数;
21、选取k值与特征数f关联,即k=2*f-1;
22、计算每个点到距其第k近的点距离,并按从大到小顺序排列得到集合s;
23、根据所述集合s找到变化最大的拐点位置并计算距离,得到eps参数;
24、计算minpts=k+1。
25、根据本公开实施例的第二方面,提供一种基于机器学习的空间数据融合装置,所述装置包括:
26、训练数据样本获取模块,用于通过提取原始多源异构空间数据中的地理位置信息和特征信息,并将所述原始多源异构空间数据中的非结构化数据转为结构化数据,得到训练数据样本;
27、聚类模块,用于对所述训练数据样本进行基于密度的聚类分析,得到聚类后空间数据;
28、融合获取模块,利用所述聚类后空间数据访问各所述训练数据样本,获取同一分类下数据样本标记簇编号clusternum,得到带有clusternum的数据集。
29、在一实施例中,所述空间数据融合装置还包括数据预处理模块,用于在对接收到的原始多源异构空间数据进行标注前,先对原始多源异构空间数据进行预处理,具体包括:
30、对原始多源异构空间数据进行清洗,对数据缺失部分进行平均值填充,对数据重复部分进行删除,对数据异样部分进行标记;对清洗后的数据使用标准差进行数据标准化。
31、根据本公开实施例的第三方面,提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述基于机器学习的空间数据融合方法。
32、根据本公开实施例的第四方面,提供一种非临时计算机可读存储介质,所述存储介质本文档来自技高网...
【技术保护点】
1.一种基于机器学习的空间数据融合方法,其特征在于,包括:
2.根据权利要求1所述的一种基于机器学习的空间数据融合方法,其特征在于,在对接收到的原始多源异构空间数据进行标注前,先对原始多源异构空间数据进行预处理,具体包括:
3.根据权利要求1所述的一种基于机器学习的空间数据融合方法,其特征在于,所述对接收到的原始多源异构空间数据进行标注,具体包括将原始多源异构空间数据中的非结构化数据转为结构化数据,即将各所述非结构化数据用所有非结构化数据的平均值替代。
4.根据权利要求1所述的一种基于机器学习的空间数据融合方法,其特征在于,所述对所述训练数据样本进行基于密度的聚类分析,得到分类后空间数据,具体包括:
5.根据权利要求4所述的一种基于机器学习的空间数据融合方法,其特征在于,所述步骤1中确定邻域参数{Eps,MinPts}的方法具体包括:
6.一种基于机器学习的空间数据融合装置,其特征在于,所述装置包括:
7.根据权利要求6所述的基于机器学习的空间数据融合装置,其特征在于,所述空间数据融合装置还包括数据预处理模块
8.一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1-权利要求5中任一项所述基于机器学习的空间数据融合方法。
9.一种非临时计算机可读存储介质,其特征在于,所述存储介质上存储有计算机指令,所述指令被处理器执行时实现如权利要求1-权利要求5中任一项所述基于机器学习的空间数据融合方法。
...【技术特征摘要】
1.一种基于机器学习的空间数据融合方法,其特征在于,包括:
2.根据权利要求1所述的一种基于机器学习的空间数据融合方法,其特征在于,在对接收到的原始多源异构空间数据进行标注前,先对原始多源异构空间数据进行预处理,具体包括:
3.根据权利要求1所述的一种基于机器学习的空间数据融合方法,其特征在于,所述对接收到的原始多源异构空间数据进行标注,具体包括将原始多源异构空间数据中的非结构化数据转为结构化数据,即将各所述非结构化数据用所有非结构化数据的平均值替代。
4.根据权利要求1所述的一种基于机器学习的空间数据融合方法,其特征在于,所述对所述训练数据样本进行基于密度的聚类分析,得到分类后空间数据,具体包括:
5.根据权利要求4所述的一种基于机器学习的空间数据融合方法,其特征在于,所述步骤1中...
【专利技术属性】
技术研发人员:杨子豪,王鹏皓,
申请(专利权)人:深圳航天智慧城市系统技术研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。