一种基于高德POI数据的海量坐标数据转换方法技术

技术编号:38524135 阅读:12 留言:0更新日期:2023-08-19 17:01
本发明专利技术公开了一种基于高德POI数据的海量坐标数据转换方法包括:基于四叉树索引原理优化矩形搜索算法,并获取研究区域POI数据;网格化研究区域,构建研究区域网格点坐标数据库,将POI坐标点与数据库进行匹配确定POI坐标点的WCS

【技术实现步骤摘要】
一种基于高德POI数据的海量坐标数据转换方法


[0001]本专利技术涉及台区地址信息解析
,具体为一种基于高德POI数据的海量坐标数据转换方法。

技术介绍

[0002]智能电网建设的大力推行和信息通信规模的不断增长,对配电网侧的精细化管理提出了更高的要求。但目前低压台区仍然面临着用户规模大、网络结构复杂、用户台区归属更新不及时等问题。
[0003]兴趣点(Point of Interest,POI)是城市信息管理系统中地理信息交互的主要数据源之一,随着互联网地图的蓬勃发展,越来越多科学研究领域将开始将互联网地图引用到各类的信息管理系统中,目前国内包括高德地图在内的所有互联网地图服务商所提供的数据信息,都是采用了由国家测绘局定义的GCJ-02坐标系系统进行加密处理;同时使用高德应用程序(ApplicationProgrammingInterface,API)接口采用矩形搜索的方法获取的POI数据量有一个限定值;如果不进行坐标数据转换和突破该搜索方法获取数据量的限定值,所获取到的POI数据将不完全、且与真实情况存在偏差;在关于用户的地址解析过程中,现阶段所使用的中文分词工具jieba在对路名的解析时不尽人意,在进行计算和统计时,容易造成关键信息的部分缺失。为解决上述问题,本专利技术提出了一种基于高德POI数据的海量坐标数据转换方法。

技术实现思路

[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。
[0005]鉴于上述存在的问题,提出了本专利技术。
[0006]因此,本专利技术解决的技术问题是:现有的开源用户数据的经纬度与真实值存在偏差,用户地址识别不准确的问题。
[0007]为解决上述技术问题,本专利技术提供如下技术方案:一种基于高德POI数据的海量坐标数据转换方法,包括:
[0008]基于四叉树索引原理优化高德API接口的矩形搜索算法,利用优化后的高德API接口获取研究区域POI数据;
[0009]将所述研究区域网格化,构建研究区域网格点坐标数据库,将POI坐标点与所述数据库进行匹配确定所述POI坐标点的WCS

84坐标,并利用双线性插值法获取无法匹配的POI坐标点的WCS

84坐标;
[0010]定义中文地址要素编注集,利用隐马尔可夫模型对所述POI数据中的源地址信息进行切词处理;
[0011]利用Trie树模型解析经切词处理后的前四层地址信息,利用状态自动机解析剩余
六层地址信息,最终获取完整的地址信息。
[0012]作为本专利技术所述的一种基于高德POI数据的海量坐标数据转换方法的一种优选方案,其中:所述四叉树索引原理,包括:当划分后的区域中满足条件的POI数量小于该阈值时,该区域将不会被继续划分;当该区域中满足条件的POI数量高于该阈值时,该区域继续被四分,直到所有子区域中满足条件的POI数量小于该阈值时,停止四分。
[0013]作为本专利技术所述的一种基于高德POI数据的海量坐标数据转换方法的一种优选方案,其中:所述四叉树索引原理优化高德API接口,包括:将研究区域的范围不断进行四分,递归直至所有的正方形区域内POI数量低于可获取上限,并将此时获得的多边形POI数量作为POI数量获取的阈值。
[0014]作为本专利技术所述的一种基于高德POI数据的海量坐标数据转换方法的一种优选方案,其中:所述POI数据,包括:坐标数据和地理位置信息数据。
[0015]作为本专利技术所述的一种基于高德POI数据的海量坐标数据转换方法的一种优选方案,其中:所述将研究区域网格化,包括:在GCJ-02经纬度坐标系下,建立经纬度间隔为0.001
°
的规格网络将矩形研究区域网格化,并使经纬度满足以下条件:
[0016][0017]其中,(L
min
,B
min
)是矩形区域右下角的坐标;(L
max
,B
max
)是矩形区域左上角的坐标。
[0018]作为本专利技术所述的一种基于高德POI数据的海量坐标数据转换方法的一种优选方案,其中:所述构建研究区域网格点坐标数据库,包括:
[0019]首先,在GCJ-02坐标系下将网格点表示为:(L0,B0),(L0,B1),...,(L
i
,B
j
),...,(L
n
,B
n
);其中,i和j分别表示行和列的号数;
[0020]其次,利用高德API接口将划分好的经纬度网格点转化为WCS

84坐标下的坐标点(WL
i
,WB
j
),此时将网格点表示为:(L
i
,B
j
,WL
i
,WB
j
);
[0021]再次,在网格点坐标中加入用行号和列号的三位16进制编码构成的ID编号,此时的网格点表示为:(ID,L
i
,B
j
,WL
i
,WB
j
);其中,ID编号表示为:ID=str(code16(i))+str(code16(j));
[0022]最后,将每个网格点坐标数据记录存入数据库中,构建网格点坐标数据库。
[0023]作为本专利技术所述的一种基于高德POI数据的海量坐标数据转换方法的一种优选方案,其中:所述利用双线性插值法获取无法匹配的POI坐标点的WCS

84坐标,包括:若POI坐标数据在网格点数据库中匹配失败,则获取距离该点最近的网格点行列号(i,j),获取方式可表示为:
[0024][0025]再获取最近的网格点对角线上的网格点的行列号表示为(i+1,j+1);
[0026]利用双线性插值法将POI坐标(L,B)转换为WCS

84坐标(WL,WB),计算公式表示为:
[0027][0028]其中,(L
i
,B
j
)表示距离最近的网格点坐标的GCJ-02坐标,(L
i+1
,B
j+1
)表示对角线上的网格点坐标的GCJ-02坐标,(WL
i
,WB
j
)表示距离最近的网格点坐标的WCS

84坐标,(WL
i+1
,WB
j+1
)表示对角线上的网格点坐标的WCS

84坐标。
[0029]作为本专利技术所述的一种基于高德POI数据的海量坐标数据转换方法的一种优选方案,其中:所述进行切词处理,包括:利用隐马尔可夫模型中有B、E、M、S四种状态对源地址进行切词处理,将切词结果存储于列表中,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于高德POI数据的海量坐标数据转换方法,其特征在于,包括:基于四叉树索引原理优化高德应用程序API接口的矩形搜索算法,利用优化后的高德API接口获取研究区域兴趣点POI数据;将所述研究区域网格化,构建研究区域网格点坐标数据库,将兴趣点POI坐标点与所述数据库进行匹配确定所述兴趣点POI坐标点的WCS

84坐标,并利用双线性插值法获取无法匹配的兴趣点POI坐标点的WCS

84坐标;定义中文地址要素编注集,利用隐马尔可夫模型对所述兴趣点POI数据中的源地址信息进行切词处理;利用Trie树模型解析经切词处理后的前四层地址信息,利用状态自动机解析剩余六层地址信息,最终获取完整的地址信息。2.如权利要求1所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述四叉树索引原理,包括:当划分后的区域中满足条件的兴趣点POI数量小于该阈值时,该区域将不会被继续划分;当该区域中满足条件的兴趣点POI数量高于该阈值时,该区域继续被四分,直到所有子区域中满足条件的兴趣点POI数量小于该阈值时,停止四分。3.如权利要求1或2所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述四叉树索引原理优化高德应用程序API接口,包括:将研究区域的范围不断进行四分,递归直至所有的正方形区域内兴趣点POI数量低于可获取上限,并将此时获得的多边形兴趣点POI数量作为兴趣点POI数量获取的阈值。4.如权利要求3所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述兴趣点POI数据,包括:坐标数据和地理位置信息数据。5.如权利要求4所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述将研究区域网格化,包括:在GCJ-02经纬度坐标系下,建立经纬度间隔为0.001
°
的规格网络将矩形研究区域网格化,并使经纬度满足以下条件:其中,(L
min
,B
min
)是矩形区域右下角的坐标;(L
max
,B
max
)是矩形区域左上角的坐标。6.如权利要求5所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述构建研究区域网格点坐标数据库,包括:首先,在GCJ-02坐标系下将网格点表示为:(L0,B0),(L0,B1),...,(L
i
,B
j
),...,(L
n
,B
n
);其中,i和j分别表示行和列的号数;其次,利用高德API接口将划分好的经纬度网格点转化为WCS

84坐标下的坐标点(WL
i
,WB
j
),此时将网格点表示为:(L
i
,B
j
,WL
i
,WB
j
);再次,在网格点坐标中加入用行号和列号的三位16进制编码构成的I...

【专利技术属性】
技术研发人员:任建宇杨晓华赵永辉杨子阳代盛国茶建华李家浩杨昊刘兴龙孙立元杨茗张益鸣艾渊吴凯松罗鑫王浩何鑫
申请(专利权)人:云南电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1