一种基于DBSCAN聚类分析的山脊线和山谷线提取方法技术

技术编号:31492432 阅读:18 留言:0更新日期:2021-12-18 12:29
本发明专利技术提供了一种基于DBSCAN聚类分析的山脊线和山谷线提取方法,先将地形数据栅格化,转化为算法可读取的文本数据,然后通过一定的策略选择DBSCAN算法的两个参数进行聚类分析,最后针对聚类的结果进一步研究地形特征。本发明专利技术通过计算机方法自动提取地形特征,是地形特征提取中一种少有的特征提取方式,实现了地形特征的自动化提取,极大的提高工作效率和准确性。率和准确性。率和准确性。

【技术实现步骤摘要】
一种基于DBSCAN聚类分析的山脊线和山谷线提取方法


[0001]本专利技术涉及地形特征提取
,将地理信息系统与数据挖掘技术相结合,通过DBSCAN聚类分析的方法实现对山脊线和山谷线的提取,具体涉及一种基于DBSCAN聚类分析的山脊线和山谷线提取方法。

技术介绍

[0002]地形特征提取是地理学中一个重要的研究内容,学者对地形特征的提取大多是对特征线或特征点的提取。特征点有山脊点(ridge)、山谷点(valley)、山顶点(peak)等。特征线有山脊线、山谷线、坡缘线、坡路线等。基于DEM的规则格网数据的地形特征点提取方法可以分为四大类:
[0003]1、基于图像处理的方法
[0004]将规则格网的DEM作为栅格图像,由于图像的RGB颜色较复杂,可以将其灰度化,图像的灰度值表示栅格的DEM值,像素大小是栅格格网的大小,规则格网上的每个DEM数据中各格网与图像中的每个像素点一一对应。在解决数字高程模型有关的问题时,可以使用基于图像处理的方法,将DEM转化为图像,如果假设栅格点的高程值越大,灰度值越亮,那么在图像中山顶点位置要比其他位置较亮,如果是一条山脊线,那么应该是沿着某一条线的灰度值是比两边的灰度值高的;山谷线相反,由于山谷线较两边的地势较低,山谷线上的颜色相对两边较暗。
[0005]2、基于地形表面几何形态分析的方法
[0006]该方法指的是一种断面极值法,其基本思想是求地形的断面曲线上的极大值点和极小值点,潜在的地形特征点与其地形断面上的局部极值点有关,认为极大值点为该地形的分水点,极小值点为该地形的汇水点,最后在提取出的特征点的基础上连接形成特征线。
[0007]3、基于地形表面流水分析算法
[0008]该方法的基本思想是流水总是遵循从高往低流向的自然规律,按照顺序计算每个DEM数据中栅格点的汇水量,如果栅格中格网点的汇水量大于给定的阈值则被认为是汇水点,按照某种规则将这些汇水点依次连接便得到了汇水线,由高到低找出区域中的每一条汇水线;根据得到的汇水线,通过计算找出各自汇水区域的边界线,便得到分水线。分水线认为是山脊线,汇水线是山谷线。
[0009]4、将集合形态分析法与地表流水模拟结合的方法
[0010]该方法的思想是首先采取较稀疏的DEM格网数据,按地表流水模拟方法去提取区域内概略的地形特征线;然后在其周围邻近区域对地形进行几何形态分析,从而精确地确定出地形特征线。
[0011]聚类分析技术作为一种重要的数据挖掘方法,在各个领域都有重要的应用价值,通过聚类方法对地形的特征提取将开创一个新的途径。

技术实现思路

[0012]本专利技术针对上述问题,提出了一种基于DBSCAN聚类分析的山脊线和山谷线提取方法。先将地形数据栅格化,转化为算法可读取的文本数据,然后通过一定的策略选择DBSCAN算法的两个参数进行聚类分析,最后针对聚类的结果进一步研究地形特征。
[0013]本专利技术一种基于DBSCAN聚类分析的山脊线和山谷线提取方法,具体步骤如下:
[0014]步骤1:地形数据准备。获取地形的DEM数据,并通过软件一系列处理,将栅格数据转成文本格式由算法读取;
[0015]步骤2:地形数据聚类分析,借助于聚类算法划分视域为多个分开的子区域SVi(i=1,2,
···
,k),k为划分的子区域的个数;
[0016]2‑
1:采用DBSCAN聚类算法的地形聚类划分,主要依据地形单元之间的距离来判断,具体做法如下:
[0017]1)基于欧氏距离的相似度计算,设任意两个点P
i
、P
j
之间的距离公式其中P
i
的坐标为(X
i
,Y
i
,Z
i
),Xi、Yi表示经纬度,Z
i
表示该位置的高程值。其中P
j
的坐标为(X
j
,Y
j
,Z
j
),X
j
、Y
j
表示经纬度,Z
j
表示该位置的高程值。
[0018]2)当d≤ε时(ε为设置的阈值),且P
i
为子区域V
i
中的类,P
j
不属于子区域V
i
中的类,V
i
=V
i
∪{P
j
}。
[0019]2‑
2:参数选择,DBSCAN聚类算法需要输入最小样本点数(用Minpts表示)和邻域半径(用EPS表示)两个参数,对于DBSCAN算法的参数选择,有如下的步骤:
[0020]1)根据地形精度,动态选择EPS的初始值,同时该初值也是EPS的下限,为MinEPS,如果地形分辨率是R
×
R,则EPS的初始值为R米,即MinEPS=R。Minpts参数选择时,如果选择从1开始,即使数据中的每个点与其相邻点的距离超过EPS,它都可以形成一个簇,这样是没有意义的,因此考虑Minpts的初值选择2。
[0021]2)逐次改变EPS的值,确定邻域半径取值的上限和下限。EPS参数用于确定格网是否成为一个簇的阈值,其本质上是邻近格网之间的平滑程度的度量。当邻近格网能够聚集在一起形成一个簇,说明它们之间应该是比较平滑,即网格之间的坡度不是很陡。一般,坡度不超过45
°
,以最大坡度45
°
,可以计算出两个相邻格网之间的中心距离因此,EPS最大可取的值是2R。
[0022]改变EPS的值,并确定其范围在之间,当簇的个数不再发生变化,并且噪声数据个数为0时,此时的EPS值为取值上限MaxEPS,确定邻域半径取值范围为(MinEPS,MaxEPS)。
[0023]3)确定了邻域半径的范围,逐次改变Minpts的值,计算在固定范围内,不同Minpts下聚类的结果,以及噪声数据的变化。
[0024]4)在地形特征线提取过程中,要将山坡位置无用的数据排除,使用DBSCAN算法来执行,可以将山坡处的点识别为噪声。需要将聚类中最小样本点的个数设置的相对大,邻域半径相对小,保证山顶位置的点能够被聚成多个簇,而山坡位置的点被识别为噪声数据。
[0025]步骤3:山脊点和山谷点的提取;
[0026]子区域的中心:子区域的中心可以用子区域内地形点的平均值来表示,子区域的
中心C可以用子区域A
i
中每个栅格点P(X,Y,Z)的平均值来表示,计算公式如式(2)

(4):
[0027][0028][0029][0030]其中,X,Y为栅格点P的地面坐标,Z为栅格点P的高程值;计算出的特征点就是地形中的山脊点和山谷点,山脊点是山脊线的特征点,是在高海拔位置,山谷点是山谷线的特征点,是在低海拔位置。
[0031]步骤4:特征线的提取,确定山脊线和山谷线。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于DBSCAN聚类分析的山脊线和山谷线提取方法,其特征在于,具体步骤如下:步骤1:地形数据获取;获取地形的DEM数据,将栅格数据转成文本格式进行读取;步骤2:地形格网点之间的相似度计算;基于欧氏距离的相似度计算,结合三维地形计算任意两个地形格网中心点P
i
和P
j
之间的距离;步骤3:地形子区域划分;采用DBSCAN算法进行子区域划分,确定邻域半径EPS和最小样本点MinPts两个参数,并借助于聚类算法划分视域为多个分开的子区域SVi(i=1,2,
···
,k),其中k为划分的子区域的个数;步骤4:山脊点和山谷点的提取;根据确定的邻域半径EPS和最小样本点MinPts,使用DBSCAN聚类算法得到最终的簇作为划分的子区域;步骤5:确定山脊线和山谷线;子区域之间的邻近关系可以用子区域完全图表示,其中节点为子区域,节点之间的边表示子区域之间的邻近关系,边的权值用子区域之间的距离表示,计算每个子区域之间的最小距离,目的是找出相邻的子区域,将相邻子区域的中心点进行连接,就构成了连接关系图。2.根据权利要求1所述的一种基于DBSCAN聚类分析的山脊线和山谷线提取方法,其特征在于,所述步骤2任意两个地形格网中心点P
i
和P
j
之间的距离由公式(1)得到:其中P
i
的坐标为(X
i
,Y
i
,Z
i
),X
i
表示经度,Y
i
表示纬度,Z
i
表示该点的高程值;P
j
的坐标为(X
j
,Y
j
,Z
j
),X
j
表示经度,Y
j
表示纬度,Z
j
表示该位置的高程值,d表示P
i
和P
j
之间的距离。3.根据权利要求1所述的一种基于DBSCAN聚类分析的山脊线和山谷线提取方法,其特征在于,所述步骤3采用DBSCAN算法进行子区域划分中,需要确定算法聚类分析的两个参数,分别是邻域半径EPS和最小样本点MinPts,其确定步骤如下:步骤3

1:根据地形精度R
×
R,动态确定EPS的初值,该初值也是EPS的下限,设为minEPS;根据地形精度R,确定EPS的初值为R,即minEPS=R...

【专利技术属性】
技术研发人员:窦万峰张成何涛
申请(专利权)人:南京师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1