海量位置点聚合的方法、装置、设备及存储介质制造方法及图纸

技术编号:24170979 阅读:16 留言:0更新日期:2020-05-16 02:56
本发明专利技术公开了一种海量位置点聚合的方法,包括:获取第一样本集合;将第一样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第二样本集合,其中,预先修改的DBSCAN模型中的密度参数为预设上限值,将第二样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第三样本集合,记录第三样本集合中的类别个数,其中,预先修改的DBSCAN模型中的密度参数为预设下限值,将第三样本集合输入至预先修改的K‑means模型进行聚类运算,进行K‑means聚类运算的次数为类别个数,得到聚类结果,将聚类结果输入至预先修改的轮廓系数模型,获取聚合点。通过上述方法,可以从海量的位置点中快速找到最优的聚合结果。本发明专利技术还公开了一种海量位置点聚合的装置、设备及存储介质。

Methods, devices, devices and storage media of massive location point aggregation

【技术实现步骤摘要】
海量位置点聚合的方法、装置、设备及存储介质
本专利技术涉及地理信息处理
,特别涉及一种海量位置点聚合的方法、装置、设备及存储介质。
技术介绍
随着计算机技术的飞速发展,对海量位置点进行监控和管理已经成为公共交通、智能地图等领域的核心应用,如何高效地从海量位置点中找到POI(兴趣点,PointofInterest)是本领域技术人员一直努力解决的技术问题。目前,常见的对位置点进行聚合的方法,主要包括利用K-means、DBSCAN等经典的机器学习聚类方法,但是经典的机器学习聚类方法,在数据点的数量很庞大的时候,性能下降非常严重,耗费的时间长,甚至不能在需求许可的时间内完成,而且不同的参数会产生不同的聚合结果。因此,急需一种可以从海量位置点中高效快速的找到最优聚合结果的方法。
技术实现思路
本公开实施例提供了一种海量位置点聚合的方法、装置、设备及存储介质。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。在一些实施例中,一种海量位置点聚合的方法,包括:获取第一样本集合;将第一样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第二样本集合,其中,预先修改的DBSCAN模型中的密度参数为预设上限值;将第二样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第三样本集合,记录第三样本集合中的类别个数,其中,预先修改的DBSCAN模型中的密度参数为预设下限值;将第三样本集合输入至预先修改的K-means模型进行聚类运算,进行K-means聚类运算的次数为类别个数,得到聚类结果;将聚类结果输入至预先修改的轮廓系数模型,获取聚合点。可选地,将聚类结果输入至预先修改的轮廓系数模型,获取聚合点,包括:根据预先修改的轮廓系数模型对聚类结果分别计算轮廓系数,将轮廓系数值最大的聚类结果所对应的位置点作为聚合点。可选地,获取第一样本集合包括:根据经纬度划分不同的网格,将位置点根据经纬度划分到不同的网格中;将网格中距离小于预设值的位置点合成一个点,作为合成位置点,将距离小于预设值的位置点的个数作为合成位置点的重复数,以合成位置点的经度、纬度、重复数生成第一样本集合。可选地,预先修改的DBSCAN模型包括:在DBSCAN模型中增加一个数量参数,数量参数为合成位置点的重复数,将DBSCAN模型中在距离条件内累加样本数量的操作,由每次加1改为每次加上重复数。可选地,预先修改的K-means模型包括:在K-means模型中增加一个数量参数,数量参数为合成位置点的重复数,将K-means模型中计算质心时,每个样本参与一次计算修改为每个样本重复参与计算,重复参与计算的次数为重复数。可选地,预先修改的轮廓系数模型包括:在轮廓系数模型中增加一个数量参数,数量参数为合成位置点的重复数,将计算样本距离的方法修改为将原有的距离乘以重复数。在一些实施例中,一种海量位置点聚合的装置,包括:第一获取模块,用于获取第一样本集合;第一分类模块,用于将第一样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第二样本集合,其中,预先修改的DBSCAN模型中的密度参数为预设上限值;第二分类模块,用于将第二样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第三样本集合,其中,预先修改的DBSCAN模型中的密度参数为预设下限值;聚类模块,用于将第三样本集合输入至预先修改的K-means模型进行聚类运算,得到聚类结果;第二获取模块,用于将聚类结果输入至预先修改的轮廓系数模型,获取聚合点。在一些实施例中,一种海量位置点聚合的装置,包括处理器和存储有程序指令的存储器,处理器被配置为在执行程序指令时,执行上述实施例提供的海量位置点聚合的方法。在一些实施例中,一种海量位置点聚合的设备,包括上述实施例提供的海量位置点聚合的装置。在一些实施例中,一种计算机可读介质,其上存储有计算机可读指令,计算机可读指令可被处理器执行以实现上述实施例提供的一种海量位置点聚合的方法。本公开实施例提供的技术方案可以包括以下有益效果:本专利技术通过修改原有的DBSCAN模型、K-means模型、轮廓系数模型,在模型原有的参数中增加一个重复数参数,以及将位置点根据经纬度划分到不同的网格中,将网格中距离小于预设值的位置点合成一个点,并将合成后的点的经纬度信息和重复数信息作为一个样本集合,将上述样本集合输入到预先修改的DBSCAN模型、K-means模型、轮廓系数模型中。通过上述方法,可以使计算时的样本量大大较少,计算时间也相应的大大减少,而且通过将样本集合依次输入DBSCAN模型、K-means模型进行聚类,再输入轮廓系数模型进行聚类结果评估,可以快速得到最优的聚合结果。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。图1是根据一示例性实施例示出的一种海量位置点聚合方法的流程示意图;图2是根据一示例性实施例示出的一种海量位置点聚合方法的流程示意图;图3是根据一示例性实施例示出的一种海量位置点聚合方法的流程示意图;图4是根据一示例性实施例示出的一种海量位置点聚合的装置示意图;图5是根据一示例性实施例示出的一种海量位置点聚合的装置示意图。具体实施方式以下描述和附图充分地示出本专利技术的具体实施方案,以使本领域的技术人员能够实践它们。图1是根据一示例性实施例示出的一种海量位置点聚合方法的流程示意图。如图1所示,本公开实施例提供了一种海量位置点聚合方法,包括:步骤S101、获取第一样本集合。具体地,第一样本集合指的是合成位置点的经度、纬度、重复数,首先,根据经纬度划分出不同的网格,将海量位置点根据经纬度划分到不同的网格中;将网格中距离小于预设值的点合成一个点,作为合成位置点,将距离小于预设值的位置点的个数作为合成位置点的重复数,以合成位置点的经度、纬度、重复数生成第一样本集合。例如,将网格中距离小于5米的点合成一个点,作为合成位置点,具体距离可以根据实际情况确定,在一些示例性场景中,网格中距离小于5米的点有8个,则合成位置点的重复数为8,合成位置点的经度经测量为东经116度23分,纬度为北纬39度54分,则第一样本集合包括“东经116度23分、北纬39度54分、8”。通过上述方法,将海量位置点根据经纬度划分到不同的网格中,将网格中距离较近的点合成一个点,可以大大减少计算时的样本量,提升运算速度。步骤S102、将第一样本本文档来自技高网...

【技术保护点】
1.一种海量位置点聚合的方法,其特征在于,包括:/n获取第一样本集合;/n将所述第一样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第二样本集合,其中,所述预先修改的DBSCAN模型中的密度参数为预设上限值;/n将所述第二样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第三样本集合,记录所述第三样本集合中的类别个数,其中,所述预先修改的DBSCAN模型中的密度参数为预设下限值;/n将所述第三样本集合输入至预先修改的K-means模型进行聚类运算,进行K-means聚类运算的次数为所述类别个数,得到聚类结果;/n将所述聚类结果输入至预先修改的轮廓系数模型,获取聚合点。/n

【技术特征摘要】
1.一种海量位置点聚合的方法,其特征在于,包括:
获取第一样本集合;
将所述第一样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第二样本集合,其中,所述预先修改的DBSCAN模型中的密度参数为预设上限值;
将所述第二样本集合输入至预先修改的DBSCAN模型进行分类,生成分类后的第三样本集合,记录所述第三样本集合中的类别个数,其中,所述预先修改的DBSCAN模型中的密度参数为预设下限值;
将所述第三样本集合输入至预先修改的K-means模型进行聚类运算,进行K-means聚类运算的次数为所述类别个数,得到聚类结果;
将所述聚类结果输入至预先修改的轮廓系数模型,获取聚合点。


2.根据权利要求1所述的方法,其特征在于,所述将所述聚类结果输入至预先修改的轮廓系数模型,获取聚合点,包括:
根据所述预先修改的轮廓系数模型对所述聚类结果分别计算轮廓系数,将轮廓系数值最大的聚类结果所对应的位置点作为聚合点。


3.根据权利要求1所述的方法,其特征在于,所述获取第一样本集合包括:
根据经纬度划分不同的网格,将位置点根据经纬度划分到不同的网格中;
将网格中距离小于预设值的位置点合成一个点,作为合成位置点,将距离小于预设值的位置点的个数作为所述合成位置点的重复数,以所述合成位置点的经度、纬度、重复数生成所述第一样本集合。


4.根据权利要求1所述的方法,其特征在于,所述预先修改的DBSCAN模型包括:
在DBSCAN模型中增加一个数量参数,所述数量参数为所述合成位置点的重复数,将DBSCAN模型中在距离条件内累加样本数量的操作,由每次加1改为每次加上重复数。


5.根据权利要求1所述的方法,其特征在于,所述预先修改的K-means模型包括:

【专利技术属性】
技术研发人员:杨晓明王巍张志平胡道生夏曙东
申请(专利权)人:北京中交兴路信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1