【技术实现步骤摘要】
一种基于高德POI数据的海量坐标数据转换方法
[0001]本专利技术涉及台区地址信息解析
,具体为一种基于高德POI数据的海量坐标数据转换方法。
技术介绍
[0002]智能电网建设的大力推行和信息通信规模的不断增长,对配电网侧的精细化管理提出了更高的要求。但目前低压台区仍然面临着用户规模大、网络结构复杂、用户台区归属更新不及时等问题。
[0003]兴趣点(Point of Interest,POI)是城市信息管理系统中地理信息交互的主要数据源之一,随着互联网地图的蓬勃发展,越来越多科学研究领域将开始将互联网地图引用到各类的信息管理系统中,目前国内包括高德地图在内的所有互联网地图服务商所提供的数据信息,都是采用了由国家测绘局定义的GCJ-02坐标系系统进行加密处理;同时使用高德应用程序(ApplicationProgrammingInterface,API)接口采用矩形搜索的方法获取的POI数据量有一个限定值;如果不进行坐标数据转换和突破该搜索方法获取数据量的限定值,所获取到的POI数据将不完全、且与真实情况存在偏差;在关于用户的地址解析过程中,现阶段所使用的中文分词工具jieba在对路名的解析时不尽人意,在进行计算和统计时,容易造成关键信息的部分缺失。为解决上述问题,本专利技术提出了一种基于高德POI数据的海量坐标数据转换方法。
技术实现思路
[0004]本部分的目的在于概述本专利技术的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简 ...
【技术保护点】
【技术特征摘要】
1.一种基于高德POI数据的海量坐标数据转换方法,其特征在于,包括:基于四叉树索引原理优化高德应用程序API接口的矩形搜索算法,利用优化后的高德API接口获取研究区域兴趣点POI数据;将所述研究区域网格化,构建研究区域网格点坐标数据库,将兴趣点POI坐标点与所述数据库进行匹配确定所述兴趣点POI坐标点的WCS
‑
84坐标,并利用双线性插值法获取无法匹配的兴趣点POI坐标点的WCS
‑
84坐标;定义中文地址要素编注集,利用隐马尔可夫模型对所述兴趣点POI数据中的源地址信息进行切词处理;利用Trie树模型解析经切词处理后的前四层地址信息,利用状态自动机解析剩余六层地址信息,最终获取完整的地址信息。2.如权利要求1所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述四叉树索引原理,包括:当划分后的区域中满足条件的兴趣点POI数量小于该阈值时,该区域将不会被继续划分;当该区域中满足条件的兴趣点POI数量高于该阈值时,该区域继续被四分,直到所有子区域中满足条件的兴趣点POI数量小于该阈值时,停止四分。3.如权利要求1或2所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述四叉树索引原理优化高德应用程序API接口,包括:将研究区域的范围不断进行四分,递归直至所有的正方形区域内兴趣点POI数量低于可获取上限,并将此时获得的多边形兴趣点POI数量作为兴趣点POI数量获取的阈值。4.如权利要求3所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述兴趣点POI数据,包括:坐标数据和地理位置信息数据。5.如权利要求4所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述将研究区域网格化,包括:在GCJ-02经纬度坐标系下,建立经纬度间隔为0.001
°
的规格网络将矩形研究区域网格化,并使经纬度满足以下条件:其中,(L
min
,B
min
)是矩形区域右下角的坐标;(L
max
,B
max
)是矩形区域左上角的坐标。6.如权利要求5所述的基于高德POI数据的海量坐标数据转换方法,其特征在于:所述构建研究区域网格点坐标数据库,包括:首先,在GCJ-02坐标系下将网格点表示为:(L0,B0),(L0,B1),...,(L
i
,B
j
),...,(L
n
,B
n
);其中,i和j分别表示行和列的号数;其次,利用高德API接口将划分好的经纬度网格点转化为WCS
‑
84坐标下的坐标点(WL
i
,WB
j
),此时将网格点表示为:(L
i
,B
j
,WL
i
,WB
j
);再次,在网格点坐标中加入用行号和列号的三位16进制编码构成的I...
【专利技术属性】
技术研发人员:任建宇,杨晓华,赵永辉,杨子阳,代盛国,茶建华,李家浩,杨昊,刘兴龙,孙立元,杨茗,张益鸣,艾渊,吴凯松,罗鑫,王浩,何鑫,
申请(专利权)人:云南电网有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。