兴趣点数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:29964197 阅读:14 留言:0更新日期:2021-09-08 09:28
本申请公开了一种兴趣点数据处理方法、装置、电子设备及存储介质,属于计算机领域,兴趣点数据处理方法包括:获取兴趣点数据,兴趣点数据包括地址字段和行政区字段;获取地址字段中的至少一级行政区信息;将至少一级行政区信息与兴趣点数据中行政区字段的信息进行匹配,得到匹配结果;根据匹配结果,更新兴趣点数据。更新兴趣点数据。更新兴趣点数据。

【技术实现步骤摘要】
兴趣点数据处理方法、装置、电子设备及存储介质


[0001]本申请属于计算机领域,具体涉及一种兴趣点数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]兴趣点(Point of Interest,POI)泛指一切可以在空间中抽象为点的地理对象。如常见的兴趣点有学校,地铁站,医院,商铺等。兴趣点数据用于准确地在地图等虚拟空间中表示现实中的地理实体,为基于地理的查询,定位,展示,个性化推荐等功能提供数据上的支撑。因此,兴趣点数据的准确性、正确性是高级功能的基础。
[0003]然而,兴趣点数据的获取源参差不齐,导致兴趣点数据中的某些字段之间的数据出现冲突。比如,兴趣点数据中包括地址字段和市字段,其中,地址字段为“深圳市福田区中康路”,而市字段为“广州市”。这样,地址字段中的“深圳市”与市字段中的“广州市”之间冲突。而这种质量不高的兴趣点数据会影响兴趣点的查询与使用。

技术实现思路

[0004]本申请实施例的目的是提供一种兴趣点数据处理方法、装置、电子设备及存储介质,能够解决质量不高的兴趣点数据会影响兴趣点的查询与使用的问题。
[0005]第一方面,本申请实施例提供了一种兴趣点数据处理方法,包括:
[0006]获取兴趣点数据,所述兴趣点数据包括地址字段和行政区字段;
[0007]获取所述地址字段中的至少一级行政区信息;
[0008]将所述至少一级行政区信息与所述兴趣点数据中所述行政区字段的信息进行匹配,得到匹配结果;
[0009]根据所述匹配结果,更新所述兴趣点数据。
[0010]第二方面,本申请实施例提供了一种兴趣点数据处理装置,包括:
[0011]第一获取模块,用于获取兴趣点数据,所述兴趣点数据包括地址字段和行政区字段;
[0012]第二获取模块,用于获取所述地址字段中的至少一级行政区信息;
[0013]匹配模块,用于将所述至少一级行政区信息与所述兴趣点数据中所述行政区字段的信息进行匹配,得到匹配结果;
[0014]更新模块,用于根据所述匹配结果,更新所述兴趣点数据。
[0015]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
[0016]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。
[0017]第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述
通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
[0018]在本申请实施例中,首先获取兴趣点数据,然后,从兴趣点数据中的地址字段中获取行政区信息,并将行政区信息与兴趣点数据中行政区字段的信息进行匹配,得到匹配结果;再然后,根据匹配结果,更新兴趣点数据。由此,可以对兴趣点数据中的错误进行纠正,提高兴趣点数据的质量,为基于兴趣点数据进行位置查询、定位等功能提供数据上的支撑。
附图说明
[0019]图1是本申请提供的一种兴趣点数据处理方法的一个实施例的流程示意图。
[0020]图2是本申请提供的采用前缀树获取行政区信息的一个实施例的示意图。
[0021]图3是本申请提供的采用前缀树获取行政区信息的另一个实施例的示意图。
[0022]图4是本申请提供的行政区信息冲突的一个实施例的示意图。
[0023]图5是本申请提供的行政区信息冲突的另一个实施例的示意图。
[0024]图6是本申请提供的用于冲突时的信息处理规则的一个实施例的示意图。
[0025]图7是本申请提供的省份字段与城市冲突的一个实施例的示意图。
[0026]图8是本申请提供的对区县信息于区县信息进行统一设置的一个实施例的示意图。
[0027]图9是本申请提供的一种兴趣点数据处理方法的另一个实施例的流程示意图。
[0028]图10是本申请提供的一种兴趣点数据处理装置的一个实施例的结构示意图。
[0029]图11是本申请提供的一种电子设备的一个实施例的结构示意图。
[0030]图12是本申请提供的一种电子设备的另一个实施例的结构示意图。
具体实施方式
[0031]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。
[0032]本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
[0033]由于兴趣点数据的获取源参差不齐、质量不一,其中,威胁到兴趣点数据正确性的有经纬度错误或者缺失,地址错误或者缺失,行政区划错误或者缺失等。兴趣点数据常见的错误有以下几点:
[0034]1、兴趣点数据中的省市区字段的信息与地址字段的信息冲突,比如,参考表1,地址中的“深圳市”与省市区字段中的“广州市”冲突。
[0035]表1
[0036][0037]2、兴趣点数据中的经纬度与省市区字段的信息冲突,比如,参考表2,经纬度不在省市区“广东省深圳市福田区”的范围内,也就是说,经纬度与省市区信息冲突。
[0038]表2
[0039][0040]3、兴趣点数据中的经纬度与地址字段的信息冲突,比如,参考表3,经纬度不在地址中的“福田区中康路136号”。
[0041]表3
[0042][0043]这些错误会影响兴趣点数据的查询与使用,因此,对这些兴趣点数据的错误与否进行检测,是确保兴趣点数据能被有效使用的前提。
[0044]在相关技术中,对兴趣点数据的处理集中在地理编码(即根据兴趣点数据中的地址生成相应的经纬度)和逆地理编码(即根据兴趣点数据中的经纬度生成相应的地址)这两个方面。但是,以上方式仅是单纯信任一个字段的信息(经纬度或者地址),并没有对经纬度与地址的冲突作检测。实际上有大量的兴趣点数据,地址和经纬度对应的位置不相符。
[0045]比如,地址为“广东省深圳市福田区中康路”,而经纬度对应的位置在山西省晋中市,这种错误可以虽然根据地理编码和逆地理编码简单的运用识别出来,但更复杂的冲突则不好识别。比如,兴趣点数据中的地址为”广东省深圳市福田区”,省市区字段分别为“广东省”、“广州市”、“天河区本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种兴趣点数据处理方法,其特征在于,包括:获取兴趣点数据,所述兴趣点数据包括地址字段和行政区字段;获取所述地址字段中的至少一级行政区信息;将所述至少一级行政区信息与所述兴趣点数据中所述行政区字段的信息进行匹配,得到匹配结果;根据所述匹配结果,更新所述兴趣点数据。2.根据权利要求1所述的方法,其特征在于,所述获取所述地址字段中的至少一级行政区信息,包括:对所述兴趣点数据中的所述地址字段的信息进行分词,得到分词词语;将所述分词词语与预设前缀树上的节点对应的信息进行匹配,其中,所述预设前缀树包括行政区信息,所述预设前缀树的同一路径上的多个节点分别对应的信息形成行政区信息;在所述分词词语与所述预设前缀树上的节点对应的信息匹配的情况下,根据所述分词词语确定行政区信息。3.根据权利要求1所述的方法,其特征在于,所述获取所述地址字段中的至少一级行政区信息之后,所述方法还包括:在所述至少一级行政区信息的行政区信息数量为多个的情况下,确定所述至少一级行政区信息中任意的两个行政区信息在所述地址字段中的位置是否重叠;若重叠,则对所述两个行政区信息进行无效处理,或者根据所述两个行政区信息从所述地址字段中重新获取行政区信息,其中,所述无效处理包括:记录所述两个行政区信息为无效的行政区信息,或者,删除所述两个行政区信息。4.根据权利要求1所述的方法,其特征在于,所述获取所述地址字段中的至少一级行政区信息之后,所述方法还包括:确定所述兴趣点数据中是否包括行政区编码,以及所述至少一级行政区信息中是否包括与所述行政区编码对应的目标行政区信息;在所述兴趣点数据中包括所述行政区编码,且所述至少一级行政区信息中包括所述目标行政区信息的情况下,根据所述行政区编码和所述目标行政区信息中的一个信息,重新设置另一个信息;在所述兴趣点数据中包括所述行政区编码,且所述至少一级行政区信息中未包括所述目标行政区信息的情况下,根据所述行政区编码,在所述地址字段的信息中添加所述目标行政区信息;在所述兴趣点数据中未包括所述行政区编码,且所述至少一级行政区信息中包括所述目标行政区信息的情况下,根据所述目标行政区信息,在所述兴趣点数据中添加所述行政区编码。5.根据权利要求1所述的方法,其特征在于,所述根据所述匹配结果,更新所述兴趣点数据,包括:在所述至少一级行政区信息中的第二行政区信息与所述兴趣点数据中的第一字段的信息匹配的情况下,确定所述第二行政区信息与所述兴趣点数据中的第二字段的信息是否冲突,其中,所述第一字段为所述第二行政区信息对应的行政区字段,所述第二字段为除所
述第一字段之外的行政区字段;在确定存在冲突的情况下,更新所述兴趣点数据。6.根据权利要求1所述的方法,其特征在于,所述兴趣点数据还包括经纬度字段对应的经纬度以及行政区编码字段对应的行政区编码;所述根据所述匹配结果,更新所述兴趣点数据,包括:在每一级所述行政区信息与对应行政区字段的信息均匹配的情况下,获取所述经纬度对应位置所在的行政区;在所述经纬度对应位置所在的行政区与所述行政区编码不匹配的情况下,更新所述兴趣点数据。7.根据权利要求6所述的方法,其特征在于,所述行政区编码包括区县编码;所述获取所述经纬度对应位置所在的行政区,包括:在预设的多个省级区域中查找所述经纬度所在的目标省级区域,其中,所述目标省级区域包括多个市级区域;在所述多个市级区域中查找所述经纬度所在的目标市级区域,其中,所述目标市级区域包括多个区县级区域;在所述多个区县级区域中查找所述经纬度所在的目标区县级区域,得到所述经纬度对应位置所在的行政区。8.一种兴趣点数据处理装置,其特征在于,包括:第一获取模块,用于获取兴趣点数据,所述兴趣点数据包括地址字段和行政区字段;第二获取模块,用于获取所述地址字段中的至少一级行政区信息;匹配模块,用于将所述至少一级行政区信息与所述兴趣点数据中所述行政区字段的信...

【专利技术属性】
技术研发人员:杨浩铭
申请(专利权)人:维沃移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1