一种基于行车轨迹的改进型GeoHash道路聚类方法技术

技术编号:23099260 阅读:23 留言:0更新日期:2020-01-14 20:37
本发明专利技术公开了一种基于行车轨迹的改进型GeoHash道路聚类方法,包括以下步骤:S1由随车采集的道路经度、纬度及时间信息通过Hash运算和base64编码得样本集D;S2向服务端输入样本集,领域参数(hash,MinPts),设置样本距离度量方式,服务端进行第一次初始化设置;S3遍历样本集中的所有点,找出其中的噪声点和非噪声点,若存在非噪声点则进行继续;S4样本集中的所有非噪声点集中为核心对象集Ω,服务端进行第二次初始化设置;S5遍历Ω

An improved geohash road clustering method based on driving path

【技术实现步骤摘要】
一种基于行车轨迹的改进型GeoHash道路聚类方法
本专利技术涉及定位系统
,尤其涉及一种基于行车轨迹的改进型GeoHash道路聚类方法。
技术介绍
农村道路交通是全国交通网络的重要组成部分,随着国家经济的发展,农村交通出行量增加。而偏远农村地区道路信息不全、采集难度较大等多方面问题,制约着手机等智能终端设备在农村地区的导航应用。随着大数据时代的到来以及智慧交通推广落地,运管局等交通管理机构源源不断的采集到乡镇客运班车行车轨迹数据,如何根据班车等车辆行驶轨迹对农村等乡镇道路进行主动发现、道路异常进行精确预警已成为一项重要的研究课题。传统的基于车辆的道路采集设备对道路信息进行随车采集,存在采集成本过高、采集信息覆盖不全、道路信息更新滞后等诸多问题。传统道路聚类算法通常采用基于密度的聚类算法,因为设备点数据较多,因此传统的道路聚类算法存在计算量过大、时间复杂度较高等问题。
技术实现思路
本专利技术的目的就在于为了解决上述问题而提供一种基于行车轨迹的改进型GeoHash道路聚类方法。为了实现上述目的,本公开提供一种基于行车轨迹的改进型GeoHash道路聚类方法,包括以下步骤:S1,由随车采集的道路经度、纬度及时间信息通过Hash运算和base64编码得样本集D;S2,向服务端输入样本集,领域参数(hash,MinPts),设置样本距离度量方式,服务端进行第一次初始化设置:核心对象集合Ω为空集,未访问样本集合Γ=D,簇划分C为空集;S3,遍历样本集中的所有点,找出其中的噪声点和非噪声点,若样本集中的所有点均为噪声点,则结束流程,若存在非噪声点则进行S4;S4,样本集中的所有非噪声点集中为核心对象集Ω,服务端进行第二次初始化设置:于Ω中随机抽取核心对象O加入到簇核心对象队列Ωcur,且将O加入簇样本集合Ck,将O从Γ中移除;S5,遍历Ωcur中的所有点,找出其中的非噪声点,服务端进行第三次初始化设置:将Ωcur的非噪声点加入Ck、,并将Ωcur的非噪声点从Γ中移除,将Ωcur的非噪声点加入Ωcur,并将O从Ωcur中移除;S6,循环进行S5至Ωcur为空集,将Ck更新至簇划分C={C1,C2,...,Ck},并将Ck从Ω移除,跳转入S3;S7,输出簇划分C={C1,C2,...,Ck},即得主干道路区域信息。优选地,随车采集的道路经度/纬度/时间的Hash运算过程如下:随车采集的道路经度/纬度/时间范围(Xmin,Xmax)均分为前区间(Xmin,(Xmin+Xmax)/2)和后区间((Xmin+Xmax)/2,Xmax),若目标经度/纬度/时间X位于前区间,则编码为0,否则编码为1;若编码为0,则将前区间再次均分为前后两个区间,若目标经度/纬度/时间X位于再次均分后的前区间,则编码为0,否则编码为1;以此种方式均分经度/纬度/时间范围2n次至达到精度要求,得经度/纬度/时间编码。优选地,将经度编码、纬度编码、时间编码合并后进行Base64编码,Base64编码长度n与误差关系如下:优选地,遍历集合找出非噪声点的方法如下:于集合中取对象点,找到对象点同一Hash领域内的子集,若子集中的点个数大于及等于MinPts,则该对象点位非噪声点,否则为噪声点。本专利技术的有益效果在于:本专利技术研发出一种基于行车轨迹的改进型GeoHash道路聚类方法,有效降低乡镇道路信息采集成本,改善乡镇道路信息更新滞后的问题。本专利技术涉及的聚类方法与传统的基于距离的密度聚类算法相比(例如DBscan算法),该专利技术的不同在于不需要计算两点之间的距离,而是通过是否为同一个Hash来确定是否为同一个簇,故大大降低了其时间复杂度。附图说明附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1是本专利技术所述的一种基于行车轨迹的改进型GeoHash道路聚类方法的流程图。具体实施方式以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。如图1所示,本公开提供一种基于行车轨迹的改进型GeoHash道路聚类方法,包括以下步骤:S1,由随车采集的道路经度、纬度及时间信息通过Hash运算和base64编码得样本集D。S2,向服务端输入样本集,领域参数(hash,MinPts),设置样本距离度量方式,服务端进行第一次初始化设置:核心对象集合Ω为空集,未访问样本集合Γ=D,簇划分C为空集。领域参数(hash,MinPts)描述领域的样本分布紧密程度,其中hash描述了某一样本的所处区域的hash值,MinPts描述了某一样本在所处hash区域内的样本个数阈值。S3,遍历样本集中的所有点,找出其中的噪声点和非噪声点,若样本集中的所有点均为噪声点,则结束流程,若存在非噪声点则进行S4;S4,样本集中的所有非噪声点集中为核心对象集Ω,服务端进行第二次初始化设置:于Ω中随机抽取核心对象O加入到簇核心对象队列Ωcur,且将O加入簇样本集合Ck,将O从Γ中移除;S5,遍历Ωcur中的所有点,找出其中的非噪声点,服务端进行第三次初始化设置:将Ωcur的非噪声点加入Ck、,并将Ωcur的非噪声点从Γ中移除,将Ωcur的非噪声点加入Ωcur,并将O从Ωcur中移除;S6,循环进行S5至Ωcur为空集,将Ck更新至簇划分C={C1,C2,...,Ck},并将Ck从Ω移除,跳转入S3;S7,输出簇划分C={C1,C2,...,Ck},即得主干道路区域信息。优选地,随车采集的道路经度/纬度/时间的Hash运算过程如下:随车采集的道路经度/纬度/时间范围(Xmin,Xmax)均分为前区间(Xmin,(Xmin+Xmax)/2)和后区间((Xmin+Xmax)/2,Xmax),若目标经度/纬度/时间X位于前区间,则编码为0,否则编码为1;若编码为0,则将前区间再次均分为前后两个区间,若目标经度/纬度/时间X位于再次均分后的前区间,则编码为0,否则编码为1;以此种方式均分经度/纬度/时间范围2n次至达到精度要求,得经度/纬度/时间编码。优选地,将经度编码、纬度编码、时间编码合并,第1、4位为经度编码,第2、5位为纬度编码、第3、6位为时间编码,后进行Base64编码,base64编码对照参照表1-1。Decimal01234567891011121314Base64012345...

【技术保护点】
1.一种基于行车轨迹的改进型GeoHash道路聚类方法,其特征在于,包括以下步骤:/nS1,由随车采集的道路经度、纬度及时间信息通过Hash运算和base64编码得样本集D;/nS2,向服务端输入样本集,领域参数(hash,MinPts),设置样本距离度量方式,服务端进行第一次初始化设置:核心对象集合Ω为空集,未访问样本集合Γ=D,簇划分C为空集;/nS3,遍历样本集中的所有点,找出其中的噪声点和非噪声点,若样本集中的所有点均为噪声点,则结束流程,若存在非噪声点则进行S4;/nS4,样本集中的所有非噪声点集中为核心对象集Ω,服务端进行第二次初始化设置:于Ω中随机抽取核心对象O加入到簇核心对象队列Ω

【技术特征摘要】
1.一种基于行车轨迹的改进型GeoHash道路聚类方法,其特征在于,包括以下步骤:
S1,由随车采集的道路经度、纬度及时间信息通过Hash运算和base64编码得样本集D;
S2,向服务端输入样本集,领域参数(hash,MinPts),设置样本距离度量方式,服务端进行第一次初始化设置:核心对象集合Ω为空集,未访问样本集合Γ=D,簇划分C为空集;
S3,遍历样本集中的所有点,找出其中的噪声点和非噪声点,若样本集中的所有点均为噪声点,则结束流程,若存在非噪声点则进行S4;
S4,样本集中的所有非噪声点集中为核心对象集Ω,服务端进行第二次初始化设置:于Ω中随机抽取核心对象O加入到簇核心对象队列Ωcur,且将O加入簇样本集合Ck,将O从Γ中移除;
S5,遍历Ωcur中的所有点,找出其中的非噪声点,服务端进行第三次初始化设置:将Ωcur的非噪声点加入Ck、,并将Ωcur的非噪声点从Γ中移除,将Ωcur的非噪声点加入Ωcur,并将O从Ωcur中移除;
S6,循环进行S5至Ωcur为空集,将Ck更新至簇划分C={C1,C2,...,Ck},并将Ck从Ω移除,跳转入S3;
S7,输出簇划分C={C1,C2,...,Ck},即得主干道路区域信息。

<...

【专利技术属性】
技术研发人员:张沛刘科
申请(专利权)人:成都海天数联科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1