地理位置聚类方法技术

技术编号:16456320 阅读:54 留言:0更新日期:2017-10-25 20:46
本发明专利技术提供了一种地理位置聚类方法,首先验证数据点集中的数据是否符合正态分布,对于符合正态分布的,先计算核函数的带宽,再计算聚类的起始点,接着根据起始点和带宽计算得到起始点需要移动到的终点,并将该过程中访问过的数据均标记,并归类为一个簇,如果有没有被访问到的数据,则将标记过的点剔除后再重新计算新的起始点,重复第一次计算起始点移动的步骤,并得到另一个簇,将所有得到的簇两两进行组合,判断是否有需要合并的簇,因此采用本发明专利技术的地理位置聚类方法能够排除提取不正确或其它原因导致的异常点,从而生产正确、无噪音的地理位置数据,还可以消除由于地理位置生产者使用不同坐标系而产生的位置漂移。

Geographic location clustering method

The invention provides a location clustering method, first verify whether the data from the data to conform to normal distribution, in line with the normal distribution, to calculate the bandwidth of kernel function, then calculate the starting point for clustering, then calculate the starting point needs to move to the starting point and end point according to the bandwidth, and the to access the data in the process are labeled and categorized as a cluster, if there is no access to the data, the deletion will be tagged after re calculation of starting point of new calculation, the starting point for a move step and repeat the first time, and to another cluster, all the clusters 22, to judge whether there is a need to merge the clusters, so the use of geographic clustering method of the invention can lead to the exclusion of outliers extraction incorrect or other reasons, thus producing the correct, no noise The location data can also eliminate the position drift caused by the geographical position producers using different coordinate systems.

【技术实现步骤摘要】
地理位置聚类方法
本专利技术属于软件算法
,具体涉及一种地理位置聚类方法。
技术介绍
随着计算机技术的发展,现今,我们需要地图导航时,大都使用电子地图,从电子地图上输入目的地后,能够直接在地图上定位该目的地。但是,现有的算法会出现提取不正确、或其它原因导致的异常点,从而会导致生产的地理位置数据不准确。或者由于地理位置生产者使用不同坐标系而产生位置漂移的问题。
技术实现思路
本专利技术是为了解决上述问题而进行的,目的在于提供一种能够排除提取不正确或其它原因导致的异常点,从而生产正确、无噪音的地理位置数据,并且还可以消除由于地理位置生产者使用不同坐标系而产生的位置漂移的地理位置聚类方法。本专利技术提供了一种地理位置聚类方法,其特征在于,包括以下步骤:步骤1,判断数据点集是否符合正态分布,如果符合则进入步骤2,如果不符合则结束;步骤2,根据所述数据点集的正态分布基于预定规则得出所述数据点集的核函数的带宽;步骤3,根据所述数据点集基于预定规则确定起始点;步骤4,根据所述起始点、所述带宽基于预定规则得到所述起始点移动到的终点,标记从所述起始点移动到所述终点的计算过程中访问过的所述数据点集中的本文档来自技高网...
地理位置聚类方法

【技术保护点】
一种地理位置聚类方法,其特征在于,包括以下步骤:步骤1,判断数据点集是否符合正态分布,如果符合则进入步骤2,如果不符合则结束;步骤2,根据所述数据点集的正态分布基于预定规则得出所述数据点集的核函数的带宽;步骤3,根据所述数据点集基于预定规则确定起始点;步骤4,根据所述起始点、所述带宽基于预定规则得到所述起始点移动到的终点,标记从所述起始点移动到所述终点的计算过程中访问过的所述数据点集中的数据,并将标记的数据归为一个簇;步骤5,判断所述数据点集中的所有数据是否均被标记过,如果所述数据点集中的所有数据均被标记过则进入步骤7,如果所述数据点集中有未被标记的数据,则进入步骤6;步骤6,将所述数据点集中...

【技术特征摘要】
1.一种地理位置聚类方法,其特征在于,包括以下步骤:步骤1,判断数据点集是否符合正态分布,如果符合则进入步骤2,如果不符合则结束;步骤2,根据所述数据点集的正态分布基于预定规则得出所述数据点集的核函数的带宽;步骤3,根据所述数据点集基于预定规则确定起始点;步骤4,根据所述起始点、所述带宽基于预定规则得到所述起始点移动到的终点,标记从所述起始点移动到所述终点的计算过程中访问过的所述数据点集中的数据,并将标记的数据归为一个簇;步骤5,判断所述数据点集中的所有数据是否均被标记过,如果所述数据点集中的所有数据均被标记过则进入步骤7,如果所述数据点集中有未被标记的数据,则进入步骤6;步骤6,将所述数据点集中被标记过的数据剔除,将未被标记的数据作为新的数据点集计算得到新的起始点,然后返回步骤4;步骤7,将得到的所有簇两两进行组合,判断每个组合中的两个簇的终点之间的距离与距离阈值的大小,如果两个簇的终点之间的距离小于距离阈值,则将该两个簇合并,如果两个簇的终点之间的距离大于距离阈值,则将两个簇分别作为单独的簇,并基于预定规则将所述数据点集中属于多个簇的多簇数据的进行归类。2.根据权利要求1所述的地理位置聚类方法,其特征在于:其中,所述步骤1中,根据数据点集分布的偏度和峰度来判断数据点集是否符合正态分布,偏度和峰度的计算方法如下:S表示偏度;C表示峰度;xi表示数据点集中的一个数据;表示数据点集中的数据均值;n为数据点集中的数据个数;表示数据变量x关于分布中心的3阶距;为数据点集的标准差。3.根据权利要求1所述的地理位置聚类方法,其特征在于:其中,步骤1中,如果数据点集不符合正态分布,在结束前,先对数据点集进行调整,如果调整后符合正态分布的则进入步骤2,如果不能调整成正态分布的则结束。4.根据权利要求1所述的地理位置聚类方法,其特征在于:其中,所述步骤2中,带宽的计算方法如下:h为核函数的带宽;为数据点集的标准差;n为数据点集中的数据个数。5.根据权利要求1所述的地理位置聚类方...

【专利技术属性】
技术研发人员:汤奇峰古丽米热·艾力肯
申请(专利权)人:晶赞广告上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1