一种兴趣点POI融合数据验证的方法、装置及设备制造方法及图纸

技术编号:35210881 阅读:26 留言:0更新日期:2022-10-15 10:24
本申请实施例提供了一种兴趣点POI融合数据验证的方法、装置及设备,获取兴趣点POI的第一POI融合数据和第二POI融合数据,第一POI融合数据为与第二POI融合数据不同来源的POI数据,第一POI融合数据包括第一经纬度和第一文本信息,第二POI融合数据包括第二经纬度和第二文本信息,根据第一经纬度和第二经纬度,以及第一文本信息和第二文本信息,分别计算第一POI融合数据和第二POI融合数据的坐标距离和文本相似度,当坐标距离小于第一预设阈值,且文本相似度值大于第二预设阈值时,生成验证成功信息,无需人工匹配和验证,不仅降低了人工成本,还提高了验证效率和验证准确性。还提高了验证效率和验证准确性。还提高了验证效率和验证准确性。

【技术实现步骤摘要】
一种兴趣点POI融合数据验证的方法、装置及设备


[0001]本申请属于地理信息数据处理
,尤其涉及一种兴趣点POI融合数据验证的方法、装置、装置及设备。

技术介绍

[0002]随着计算机科学的蓬勃发展,大数据技术的日益成熟,兴趣点(Point of Interest,POI)在城市规划和城市服务中扮演着重要角色。兴趣点是指一切可以被抽象为点的地理实体,每一条POI数据包含地理实体的名称、经纬度、地址、类别等信息,涵盖了广泛的地理空间和位置属性。
[0003]目前,人们对POI数据的研究正在从单个或少数POI数据,扩大到对成千上万POI数据的宏观感知,从而对POI数据选址等需求进行更优的决策。由于不同的数据源各有优劣势,为了更好地根据需求进行决策,融合数据可以发挥不同数据源的优势。因各数据源对同一POI的名称、地址等重要信息不尽相同,需对融合数据的正确性进行验证,但现有的验证方法人工成本高,验证效率低,验证准确性有待提高。

技术实现思路

[0004]本申请实施例提供一种兴趣点POI融合数据验证的方法、装置及设备,能够降低验证POI融合数据的人工成本,提高验证效率和验证准确性。
[0005]第一方面,本申请实施例提供一种兴趣点POI融合数据验证的方法,方法包括:获取兴趣点POI的第一POI融合数据和第二POI融合数据,第一POI融合数据为与第二POI融合数据不同来源的POI数据,第一POI融合数据包括第一经纬度和第一文本信息,第二POI融合数据包括第二经纬度和第二文本信息;根据第一经纬度和第二经纬度,计算第一POI融合数据和第二POI融合数据的坐标距离;根据第一文本信息和第二文本信息,计算第一POI融合数据和第二POI融合数据的文本相似度;当坐标距离小于第一预设阈值,且文本相似度值大于第二预设阈值时,生成验证成功信息。
[0006]在一些可能的实现方式中,第一文本信息包括第一名称文本信息和第一地址文本信息,第二文本信息包括第二名称文本信息和第二地址文本信息,文本相似度包括名称文本相似度和地址文本相似度;根据第一文本信息和第二文本信息,计算第一POI融合数据和第二POI融合数据的文本相似度,包括:根据第一名称文本信息和第二名称文本信息,计算第一POI融合数据和第二POI融合数据的名称文本相似度;根据第一地址文本信息和第二地址文本信息,计算第一POI融合数据和第二POI融合数据的地址文本相似度。
[0007]在一些可能的实现方式中,当坐标距离小于第一预设阈值,且文本相似度值大于第二预设阈值时,生成验证成功信息,包括:当坐标距离小于第一预设阈值,且名称文本相似度大于第二预设阈值时,或者,当坐标距离小于第一预设阈值,且地址文本相似度大于第二预设阈值时,生成验证成功信息。
[0008]在一些可能的实现方式中,根据第一文本信息和第二文本信息,计算第一POI融合数据和第二POI融合数据的文本相似度,包括:根据第一POI融合数据、第二POI融合数据和坐标距离,生成逗号分隔值CSV格式文件,CSV格式文件包括第一文本信息和第二文本信息;提取CSV格式文件中的第一文本信息和第二文本信息;根据第一文本信息和第二文本信息,计算第一POI融合数据和第二POI融合数据的文本相似度。
[0009]在一些可能的实现方式中,提取CSV格式文件中的第一文本信息和第二文本信息之后,方法还包括:采用预设字符替换第一文本信息和第二文本信息中的空值。
[0010]在一些可能的实现方式中,根据第一文本信息和第二文本信息,计算第一POI融合数据和所述第二POI融合数据的文本相似度,包括:根据第一文本信息和第二文本信息,通过预设可调用函数计算第一POI融合数据和第二POI融合数据的文本相似度。
[0011]第二方面,本申请实施例提供了一种兴趣点POI融合数据验证的装置,装置包括:获取模块,用于获取兴趣点POI的第一POI融合数据和第二POI融合数据,第一POI融合数据为与第二POI融合数据不同来源的POI数据,第一POI融合数据包括第一经纬度和第一文本信息,第二POI融合数据包括第二经纬度和第二文本信息;计算模块,用于根据第一经纬度和第二经纬度,计算第一POI融合数据和第二POI融合数据的坐标距离;计算模块,还用于根据第一文本信息和第二文本信息,计算第一POI融合数据和第二POI融合数据的文本相似度;生成模块,用于当坐标距离小于第一预设阈值,且文本相似度值大于第二预设阈值时,生成验证成功信息。
[0012]在一些可能的实现方式中,第一文本信息包括第一名称文本信息和第一地址文本信息,第二文本信息包括第二名称文本信息和第二地址文本信息,文本相似度包括名称文本相似度和地址文本相似度;计算模块,具体用于:根据第一名称文本信息和第二名称文本信息,计算第一POI融合数据和第二POI融合数据的名称文本相似度;根据第一地址文本信息和第二地址文本信息,计算第一POI融合数据和第二POI融合数据的地址文本相似度。
[0013]第三方面,本申请实施例提供了一种兴趣点POI融合数据验证设备,设备包括:处理器,以及存储有计算机程序指令的存储器;处理器读取并执行计算机程序指令,以实现第一方面或者第一方面任意一种可能的实现方式中的兴趣点POI融合数据验证的方法。
[0014]第四方面,本申请实施例提供了一种计算机可读存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面或者第一方面任意一种可能的实现方式中的兴趣点POI融合数据验证的方法。
[0015]本申请实施例提供的一种兴趣点POI融合数据验证的方法、装置及设备,获取兴趣点POI的第一POI融合数据和第二POI融合数据,第一POI融合数据为与第二POI融合数据不同来源的POI数据,第一POI融合数据包括第一经纬度和第一文本信息,第二POI融合数据包括第二经纬度和第二文本信息,根据第一经纬度和第二经纬度,以及第一文本信息和第二文本信息,分别计算第一POI融合数据和第二POI融合数据的坐标距离和文本相似度,当坐标距离小于第一预设阈值,且文本相似度值大于第二预设阈值时,生成验证成功信息,无需人工匹配和验证,不仅降低了人工成本,还提高了验证效率和验证准确性。
附图说明
[0016]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本申请实施例提供的一种兴趣点POI融合数据验证方法的流程示意图。
[0018]图2是本申请实施例提供的一种兴趣点POI融合数据验证装置的结构示意图。
[0019]图3是本申请实施例提供的一种兴趣点POI融合数据验证设备的结构示意图。
具体实施方式
[0020]下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种兴趣点POI融合数据验证的方法,其特征在于,包括:获取兴趣点POI的第一POI融合数据和第二POI融合数据,所述第一POI融合数据为与所述第二POI融合数据不同来源的POI数据,所述第一POI融合数据包括第一经纬度和第一文本信息,所述第二POI融合数据包括第二经纬度和第二文本信息;根据所述第一经纬度和所述第二经纬度,计算所述第一POI融合数据和所述第二POI融合数据的坐标距离;根据所述第一文本信息和所述第二文本信息,计算所述第一POI融合数据和所述第二POI融合数据的文本相似度;当所述坐标距离小于第一预设阈值,且所述文本相似度值大于第二预设阈值时,生成验证成功信息。2.根据权利要求1所述的POI融合数据验证的方法,其特征在于,所述第一文本信息包括第一名称文本信息和第一地址文本信息,所述第二文本信息包括第二名称文本信息和第二地址文本信息,所述文本相似度包括名称文本相似度和地址文本相似度;所述根据所述第一文本信息和所述第二文本信息,计算所述第一POI融合数据和所述第二POI融合数据的文本相似度,包括:根据所述第一名称文本信息和所述第二名称文本信息,计算所述第一POI融合数据和所述第二POI融合数据的所述名称文本相似度;根据所述第一地址文本信息和所述第二地址文本信息,计算所述第一POI融合数据和所述第二POI融合数据的所述地址文本相似度。3.根据权利要求2所述的POI融合数据验证的方法,其特征在于,当所述坐标距离小于第一预设阈值,且所述文本相似度值大于第二预设阈值时,生成验证成功信息,包括:当所述坐标距离小于第一预设阈值,且所述名称文本相似度大于第二预设阈值时,或者,当所述坐标距离小于第一预设阈值,且所述地址文本相似度大于第二预设阈值时,生成验证成功信息。4.根据权利要求1所述的POI融合数据验证的方法,其特征在于,所述根据所述第一文本信息和所述第二文本信息,计算所述第一POI融合数据和所述第二POI融合数据的文本相似度,包括:根据所述第一POI融合数据、所述第二POI融合数据和所述坐标距离,生成逗号分隔值CSV格式文件,所述CSV格式文件包括所述第一文本信息和所述第二文本信息;提取所述CSV格式文件中的所述第一文本信息和所述第二文本信息;根据所述第一文本信息和所述第二文本信息,计算所述第一POI融合数据和所述第二POI融合数据的文本相似度。5.根据权利要求4所述的POI融合数据验证的方法,其特征在于,提取所述CSV格式文...

【专利技术属性】
技术研发人员:曹莉英
申请(专利权)人:上海钐昆网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1