一种用于确定兴趣点POI数据的方法与装置制造方法及图纸

技术编号:22166816 阅读:19 留言:0更新日期:2019-09-21 10:32
本申请实施例提供了一种用于确定兴趣点POI数据的方法与装置,涉及POI技术领域。该方法包括:基于第一数据源中的第一POI和第一POI的区域范围,确定第一POI的至少一个周边区域,周边区域是基于区域范围确定的、与第一POI的区域相邻的区域;确定第二数据源中的第二POI;若第二POI的地理位置标识与第一POI所对应的任一地理位置标识相同,确定第一POI和第二POI的相似度,所述第一POI所对应的地理位置标识包括所述第一POI的地理位置标识和所述至少一个周边区域的地理位置标识;若相似度大于设定相似度阈值,则对第一POI的数据和第二POI的数据进行融合,确定得到融合后的POI数据,实现了快速寻找周围潜在匹配的POI,降低了运算量,提高了融合结果的可靠性。

A Method and Device for Determining POI Data of Interest Points

【技术实现步骤摘要】
一种用于确定兴趣点POI数据的方法与装置
本申请涉及POI
,具体而言,本申请涉及一种用于确定兴趣点POI数据的技术。
技术介绍
POI(PointofInterest,兴趣点)是电子地图中必不可少的信息,其通常包含名称、地址、类型和经纬度等信息,用于表征日常生活中遇到的各种地理场所,如学校、房子、医院、景点等。而当前不同电子地图都有一套自身的POI类目体系,不同类目体系下的POI存在诸如名称、地址命名等差异,这也就导致了这些POI数据在空间位置、属性信息以及丰富程度等方面的差异。为有效地消除不同源POI数据间的不一致性,并把它们组织成一套内容准确、可供用户使用的数据,通常采用遍历、经纬度网格编码等方式对多源POI数据进行融合,而该等方法在处理大规模POI数据是存在诸如计算量大、融合错误率高等问题。
技术实现思路
本申请实施例的目的旨在至少能解决上述的技术缺陷之一,特提出以下技术方案:第一方面,本申请实施例提供了一种用于确定兴趣点POI数据的方法,该方法包括:获取第一数据源中的第一POI;基于第一POI和第一POI的区域范围,确定第一POI的至少一个周边区域,周边区域是基于区域范围确定的、与第一POI的区域相邻的区域;确定第二数据源中的第二POI;若第二POI的地理位置标识与第一POI所对应的任一地理位置标识相同,确定第一POI和第二POI的相似度,其中,第一POI所对应的地理位置标识包括第一POI的地理位置标识和至少一个周边区域的地理位置标识;若相似度大于设定相似度阈值,则对第一POI的数据和第二POI的数据进行融合,确定得到融合后的POI数据。在一个可选实施例中,第一数据源和第二数据源中的POI的区域范围包括至少两种范围大小;确定第二数据源中的第二POI,包括:根据第一POI的区域范围的范围大小,从第二数据源中确定与第一POI的区域范围的范围大小相同的第二POI。在一个可选实施例中,确定第一POI和第二POI的相似度,包括:根据第一POI的名称与第二POI的名称,确定名称分别对应的分类;当第一POI的名称与第二POI的名称属于同一分类时,确定第一POI和第二POI的相似度。在一个可选实施例中,确定第一POI和第二POI的相似度包括:分别获取第一POI的各个属性信息和第二POI的各个属性信息;根据第一POI的各个属性信息和第二POI的各个属性信息,确定第一POI和第二POI的相似度。在一个可选实施例中,根据第一POI的各个属性信息和第二POI的各个属性信息,确定第一POI和第二POI的相似度,包括:根据第一POI的各个属性信息和第二POI的各个属性信息,确定第一POI和第二POI针对各个属性信息的属性相似度;根据各个属性信息的属性相似度以及预定的各个属性信息的权重,确定第一POI和第二POI的相似度。在一个可选实施例中,确定各个属性信息的权重,包括:获取训练样本,训练样本包括各样本POI对,以及样本POI对中各POI的属性信息,样本POI对中两个POI的数据能够融合;基于目标函数、样本POI对中各POI的属性信息、以及权重约束条件,对目标函数进行迭代优化,得到各个属性信息的权重。在一个可选实施例中,POI的属性信息包括以下至少一项:名称、地址、类型、位置;POI的属性相似度包括以下至少任一项:名称相似度、地址相似度、类型相似度、位置相似度。在一个可选实施例中,根据第一POI的各个属性信息和第二POI的各个属性信息,确定针对各个属性信息的属性相似度,包括:根据第一POI的类型和第二POI的类型,通过预建立的POI类型相互映射表,确定针对类型的类型相似度;POI类型相互映射表是预先建立的第一数据源中POI和第二数据源中POI的POI类型相互映射表。第二方面,本申请实施例提供了一种用于确定兴趣点POI数据的合装置,其中,该融合装置包括:第一获取模块,用于获取第一数据源中的第一POI;第一确定模块,用于基于第一POI和第一POI的区域范围,确定第一POI的至少一个周边区域,周边区域是基于区域范围确定的、与第一POI的区域相邻的区域;第二确定模块,用于确定第二数据源中的第二POI;第三确定模块,用于若第二POI的地理位置标识与第一POI所对应的任一地理位置标识相同,确定第一POI和第二POI的相似度,其中,第一POI所对应的地理位置标识包括第一POI的地理位置标识和至少一个周边区域的地理位置标识;融合模块,用于若相似度大于设定相似度阈值,则对第一POI的数据和第二POI的数据进行融合,确定得到融合后的POI数据。在一个可选实施例中,第一数据源和第二数据源中的POI的区域范围包括至少两种范围大小;第一确定模块,用于根据第一POI的区域范围的范围大小,从第二数据源中确定与第一POI的区域范围的范围大小相同的第二POI。在一个可选实施例中,第三确定模块,用于根据第一POI的名称与第二POI的名称,确定名称分别对应的分类;当第一POI的名称与第二POI的名称属于同一分类时,确定第一POI和第二POI的相似度。在一个可选实施例中,第三确定模块,用于分别获取第一POI的各个属性信息和第二POI的各个属性信息;根据第一POI的各个属性信息和第二POI的各个属性信息,确定第一POI和第二POI的相似度。在一个可选实施例中,第三确定模块,用于根据第一POI的各个属性信息和第二POI的各个属性信息,确定第一POI和第二POI针对各个属性信息的属性相似度;根据各个属性信息的属性相似度以及预定的各个属性信息的权重,确定第一POI和第二POI的相似度。在一个可选实施例中,该融合装置还包括权重训练模块;权重训练模块,用于获取训练样本,训练样本包括各样本POI对,以及样本POI对中各POI的属性信息,样本POI对中两个POI的数据能够融合;基于目标函数、样本POI对中各POI的属性信息、以及权重约束条件,对目标函数进行迭代优化,得到各个属性信息的权重。在一个可选实施例中,POI的属性信息包括以下至少一项:名称、地址、类型、位置;POI的属性相似度包括以下至少任一项:名称相似度、地址相似度、类型相似度、位置相似度。在一个可选实施例中,第三确定模块,用于根据第一POI的类型和第二POI的类型,通过预建立的POI类型相互映射表,确定针对类型的类型相似度;POI类型相互映射表是预先建立的第一数据源中POI和第二数据源中POI的POI类型相互映射表。第三方面,本申请实施例提供了一种电子装置,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行如本申请实施例的第一方面的一种用于确定兴趣点POI数据的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该程序被处理器执行时实现如本申请实施例的第一方面的一种用于确定兴趣点POI数据的方法。本申请实施例提供的技术方案带来的有益效果是:在本申请实施例的方案中,基于第一数据源中的第一POI和第一POI的区域范围,确定第一POI的至少一个周边区域,周边区域是基于区域范围确定的、与第一POI的区域相邻的区域;确定第二数据源中的第二POI;若第二POI的地理位置标识与第一POI所对应的任一地理位置标本文档来自技高网...

【技术保护点】
1.一种用于确定兴趣点POI数据的方法,其中,该方法包括:获取第一数据源中的第一POI;基于所述第一POI和所述第一POI的区域范围,确定所述第一POI的至少一个周边区域,所述周边区域是基于所述区域范围确定的、与所述第一POI的区域相邻的区域;确定所述第二数据源中的第二POI;若所述第二POI的地理位置标识与所述第一POI所对应的任一地理位置标识相同,确定所述第一POI和所述第二POI的相似度,其中,所述第一POI所对应的地理位置标识包括所述第一POI的地理位置标识和所述至少一个周边区域的地理位置标识;若所述相似度大于设定相似度阈值,则对所述第一POI的数据和所述第二POI的数据进行融合,确定得到融合后的POI数据。

【技术特征摘要】
1.一种用于确定兴趣点POI数据的方法,其中,该方法包括:获取第一数据源中的第一POI;基于所述第一POI和所述第一POI的区域范围,确定所述第一POI的至少一个周边区域,所述周边区域是基于所述区域范围确定的、与所述第一POI的区域相邻的区域;确定所述第二数据源中的第二POI;若所述第二POI的地理位置标识与所述第一POI所对应的任一地理位置标识相同,确定所述第一POI和所述第二POI的相似度,其中,所述第一POI所对应的地理位置标识包括所述第一POI的地理位置标识和所述至少一个周边区域的地理位置标识;若所述相似度大于设定相似度阈值,则对所述第一POI的数据和所述第二POI的数据进行融合,确定得到融合后的POI数据。2.根据权利要求1所述的方法,其中,所述第一数据源和所述第二数据源中的POI的区域范围包括至少两种范围大小;所述确定所述第二数据源中的第二POI,包括:根据所述第一POI的区域范围的范围大小,从所述第二数据源中确定与所述第一POI的区域范围的范围大小相同的第二POI。3.根据权利要求1或2所述的方法,其中,所述确定所述第一POI和所述第二POI的相似度,包括:根据所述第一POI的名称与所述第二POI的名称,确定名称分别对应的分类;当所述第一POI的名称与所述第二POI的名称属于同一分类时,确定所述第一POI和所述第二POI的相似度。4.根据权利要求1所述的方法,其中,确定所述第一POI和所述第二POI的相似度包括:分别获取所述第一POI的各个属性信息和所述第二POI的各个属性信息;根据所述第一POI的各个属性信息和所述第二POI的各个属性信息,确定所述第一POI和所述第二POI的相似度。5.根据权利要求4所述的方法,其中,所述根据所述第一POI的各个属性信息和所述第二POI的各个属性信息,确定所述第一POI和所述第二POI的相似度,包括:根据所述第一POI的各个属性信息和所述第二POI的各个属性信息,确定所述第一POI和所述第二POI针对各个属性信息的属性相似度;根据各个属性信息的属性相似度以及预定的各个属性信息的权重,确定所述第一POI和所述第二POI的相似度。6.根据权利要求5所述的方法,其中,所述确...

【专利技术属性】
技术研发人员:张金宝张长旺黄新营张纪红
申请(专利权)人:深圳市腾讯计算机系统有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1