【技术实现步骤摘要】
一种兴趣点数据关联方法、装置及服务器
本申请涉及互联网领域,尤其是一种兴趣点数据关联方法、装置及服务器。
技术介绍
POI(PointOfInterest,兴趣点)数据是基于位置服务的核心数据,在电子地图上的运用场景非常广泛,例如,导航前选择目的地、查看周边的餐馆等。随着互联网技术的快速发展,POI数据的来源也越来越多,如谷歌地图、百度地图、高德地图等。针对同一个地点A,不同来源的POI数据(如POI名称和经纬度坐标等)也可能不同。例如,针对地点A,谷歌地图提供的POI数据1包括POI名称(如中心大厦)和经纬度坐标(如30.2798746584,120.0261959655),百度地图提供的POI数据2包括POI名称(如电子中心大厦)和经纬度坐标(如30.2858048989,120.0327567404),高德地图提供的POI数据3包括POI名称(如电子研发中心大厦)和经纬度坐标(如30.2798800000,120.0262100000)。由于POI数据1、POI数据2、POI数据3的POI名称不同,经纬度坐标也不同,因此,无法将针对同一个地点A的POI数据1、POI数据2、POI数据3关联起来,也就无法基于POI数据1、POI数据2、POI数据3进行统一处理。
技术实现思路
本申请提供一种兴趣点数据关联方法,应用于服务器,该方法包括:从第一兴趣点数据中获取第一位置和第一名称;从第二兴趣点数据中获取第二位置和第二名称;根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一 ...
【技术保护点】
1.一种兴趣点数据关联方法,其特征在于,应用于服务器,该方法包括:从第一兴趣点数据中获取第一位置和第一名称;从第二兴趣点数据中获取第二位置和第二名称;根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。
【技术特征摘要】
1.一种兴趣点数据关联方法,其特征在于,应用于服务器,该方法包括:从第一兴趣点数据中获取第一位置和第一名称;从第二兴趣点数据中获取第二位置和第二名称;根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据;若是,则将所述第一兴趣点数据和所述第二兴趣点数据进行关联。2.根据权利要求1所述的方法,其特征在于,所述根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据,包括:确定候选集合,所述候选集合用于存储第二兴趣点数据;若所述候选集合不为空,针对所述候选集合中的第二兴趣点数据,根据所述第一位置和第二位置的距离、所述第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。3.根据权利要求2所述的方法,其特征在于,所述确定候选集合,包括:将数据库中的第二兴趣点数据存储到所述候选集合;或者,针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二位置,确定是否将所述第二兴趣点数据存储到所述候选集合;或者,针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合;或者,针对数据库中的第二兴趣点数据,根据所述第二兴趣点数据中的第二位置和第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合。4.根据权利要求3所述的方法,其特征在于,根据所述第二兴趣点数据中的第二位置,确定是否将所述第二兴趣点数据存储到所述候选集合,包括:若所述第二位置与所述第一位置的距离小于距离阈值,则将所述第二兴趣点数据存储到候选集合;否则,拒绝将所述第二兴趣点数据存储到候选集合。5.根据权利要求3所述的方法,其特征在于,根据所述第二兴趣点数据中的第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合,包括:若所述第二名称与所述第一名称的相似度大于相似度阈值,将所述第二兴趣点数据存储到候选集合;否则,拒绝将所述第二兴趣点数据存储到候选集合。6.根据权利要求3所述的方法,其特征在于,所述根据所述第二兴趣点数据中的第二位置和第二名称,确定是否将所述第二兴趣点数据存储到所述候选集合的过程,具体包括:若所述第二位置与所述第一位置的距离小于距离阈值,且所述第二名称与所述第一名称的相似度大于相似度阈值,则将所述第二兴趣点数据存储到候选集合;否则,拒绝将所述第二兴趣点数据存储到候选集合。7.根据权利要求4或6所述的方法,其特征在于,所述方法还包括:获取训练集合,所述训练集合包括多个位置;从训练集合中获取针对同一地点的两个位置,并计算所述两个位置的距离;利用计算的距离的平均值,获取所述距离阈值。8.根据权利要求5或6所述的方法,其特征在于,所述方法还包括:获取训练集合,所述训练集合包括多个名称;从训练集合中获取针对同一地点的两个名称,计算所述两个名称的相似度;利用计算的相似度的平均值,获取所述相似度阈值。9.根据权利要求2所述的方法,其特征在于,所述方法还包括:若所述候选集合为空,则确定不存在与所述第一兴趣点数据是同一地点的第二兴趣点数据,并将所述第一兴趣点数据存储到数据库中。10.根据权利要求1或2所述的方法,其特征在于,所述根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据,包括:根据所述第一位置和所述第二位置的距离、距离权重因子,所述第一名称和所述第二名称的相似度、相似度权重因子,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。11.根据权利要求10所述的方法,其特征在于,所述根据所述第一位置和所述第二位置的距离、距离权重因子,所述第一名称和所述第二名称的相似度、相似度权重因子,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据的过程,具体包括:根据所述第一位置和所述第二位置的距离、距离权重因子计算第一参考值,根据所述第一名称和所述第二名称的相似度、相似度权重因子计算第二参考值;根据所述第一参考值和所述第二参考值,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据。12.根据权利要求10所述的方法,其特征在于,所述方法还包括:获取训练集合,所述训练集合包括多个位置和多个名称;从训练集合中获取针对同一地点的两个位置,计算所述两个位置的距离;从训练集合中获取针对同一地点的两个名称,计算所述两个名称的相似度;利用计算的距离、计算的相似度,获取距离权重因子和相似度权重因子。13.根据权利要求12所述的方法,其特征在于,所述利用计算的距离、计算的相似度,获取距离权重因子和相似度权重因子的过程,包括:基于计算的距离、计算的相似度,利用逻辑回归算法获取所述距离权重因子和所述相似度权重因子。14.根据权利要求1所述的方法,其特征在于,所述将所述第一兴趣点数据和所述第二兴趣点数据进行关联的过程,包括:在数据库记录所述第一兴趣点数据和所述第二兴趣点数据的对应关系;或,对所述第一兴趣点数据和所述第二兴趣点数据生成同一hash值,在数据库记录所述hash值、所述第一兴趣点数据和所述第二兴趣点数据的对应关系。15.根据权利要求1所述的方法,其特征在于,所述根据第一位置和第二位置的距离、第一名称和第二名称的相似度,确定所述第一兴趣点数据和所述第二兴趣点数据是否为同一地点的数据之后,所述方法还包括:若否,则将所述第一兴趣点数据存储到数据库中。16.一种兴趣点数据关联方法,其特征在于...
【专利技术属性】
技术研发人员:熊罗凯,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。