信息处理方法及装置、终端设备及计算机可读存储介质制造方法及图纸

技术编号:17097657 阅读:20 留言:0更新日期:2018-01-21 09:35
本发明专利技术提供一种用于对地图中的兴趣点进行去重的信息处理方法、信息处理装置、终端设备以及计算机存储介质。该信息处理方法包括:获取地图中的多个兴趣点作为待去重兴趣点集合,并且获取所述待去重兴趣点集合中每个兴趣点的多个决策树属性;确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度;以及利用预先根据兴趣点的决策树属性构建的决策树,基于所述两个兴趣点之间的每个决策树属性的相似度来确定所述两个兴趣点是否相同,从而对所述待去重兴趣点集合中的兴趣点进行去重。根据本发明专利技术实施例的信息处理装置、信息处理方法、终端设备以及存储介质至少能够提高去重处理的准确率。

Information processing methods and devices, terminal equipment and computer readable storage media

The invention provides an information processing method, an information processing device, a terminal device and a computer storage medium for removing interest points in maps. Including the information processing method: obtaining a plurality of points of interest in the map as a point of interest to re set, and obtain the multiple attribute decision tree to heavy interest points set for each point of interest; determining the weight between the points of interest in the collection of any two points of interest of each attribute decision tree according to the similarity; and the use of pre decision tree attribute points of interest in the construction, to determine the two points of interest are the same for each attribute decision tree based on the similarity between the two points of interest, so as to set weight points of interest to the point of interest to heavy. The information processing device, the information processing method, the terminal device and the storage medium in accordance with the embodiment of the invention can at least improve the accuracy of the reprocessing.

【技术实现步骤摘要】
信息处理方法及装置、终端设备及计算机可读存储介质
本专利技术涉及地图信息处理领域,尤其涉及一种用于对地图上的兴趣点进行去重的信息处理方法、信息处理装置、终端设备以及计算机可读存储介质。
技术介绍
随着地理信息系统的发展,人们越来越依赖于电子地图获取其感兴趣的地点(称为兴趣点)。现有的电子地图系统拥有大量的兴趣点,例如百度地图拥有千万级的兴趣点,而如何确保电子地图上兴趣点的没有冗余和重复,从而提升用户使用电子地图的体验,是目前亟需解决的问题。
技术实现思路
本专利技术实施例提供一种信息处理方法、信息处理装置、终端设备以及计算机可读存储介质,以至少解决现有技术中的以上技术问题。第一方面,本专利技术实施例提供了一种用于对地图中的兴趣点进行去重的信息处理方法,包括以下步骤:获取地图中的多个兴趣点作为待去重兴趣点集合,并且获取所述待去重兴趣点集合中每个兴趣点的多个决策树属性;确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度;以及利用预先根据兴趣点的决策树属性构建的决策树,基于所述两个兴趣点之间的每个决策树属性的相似度来确定所述两个兴趣点是否相同,从而对所述待去重兴趣点集合中的兴趣点进行去重。第二方面,本专利技术实施例提供了一种用于对地图中的兴趣点进行去重的信息处理装置,包括:获取单元,用于获取地图中的多个兴趣点作为待去重兴趣点集合,并且获取所述待去重兴趣点集合中每个兴趣点的多个决策树属性;相似度确定单元,用于确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度;以及去重单元,用于利用预先根据兴趣点的决策树属性构建的决策树,基于所述两个兴趣点之间的每个属性的相似度来确定所述两个兴趣点是否相同,从而对所述待去重兴趣点集合中的兴趣点进行去重。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。第三方面,本专利技术实施例提供了一种终端设备,所述终端设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的信息处理方法。所述终端设备还可以包括通信接口,用于终端设备与其他设备或通信网络通信。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其存储有计算机程序,其中,该程序被处理器执行时实现如上所述的信息处理方法。上述技术方案中的一个技术方案至少具有如下优点或有益效果:通过利用决策树确定两个兴趣点之间是否相似能够提高去重处理的准确率。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1为根据本专利技术一个实施例的用于对地图中的兴趣点进行去重的信息处理方法的示例性流程图。图2示出了根据本专利技术实施例的一种决策树的示例性结构。图3示例性示出了根据本专利技术一个实施例的确定两个兴趣点之间的名称属性的相似度的一种示例性处理。图4示例性示出了根据本专利技术一个实施例的确定两个兴趣点之间的地址属性的相似度的一种示例性处理。图5示例性示出了根据本专利技术一个实施例的确定两个兴趣点之间的坐标相似度的一种示例性处理。图6示出了根据本专利技术实施例的一种信息处理装置的示例性结构。图7示出了根据本专利技术实施例的一种终端设备的示例性结构。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。本专利技术实施例提供一种用于对地图中的兴趣点进行去重的信息处理方法。图1是根据本专利技术一个实施例的用于对地图中的兴趣点进行去重的信息处理方法的示例性流程图。如图1所示,根据本专利技术一个实施例的用于对地图中的兴趣点进行去重的信息处理方法包括以下步骤:在步骤S101,获取地图中的多个兴趣点作为待去重兴趣点集合,并且获取所述待去重兴趣点集合中每个兴趣点的多个决策树属性;在步骤S102,确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度;以及在步骤S103,利用预先根据兴趣点的决策树属性构建的决策树,基于所述两个兴趣点之间的每个决策树属性的相似度来确定所述两个兴趣点是否相同,从而对所述待去重兴趣点集合中的兴趣点进行去重。更具体地,根据本专利技术的实施例,在获取地图中的多个兴趣点及其决策树属性的步骤S101之前,可以预先根据兴趣点的多个决策树属性构建的决策树,以利用该决策树并且根据两个兴趣点之间决策树属性的相似度,确定兴趣点之间的相似度。兴趣点的决策树属性例如包括:兴趣点的名称、兴趣点的地址、兴趣点的联系方式、兴趣点的坐标、兴趣点的分类等基础属性信息。但是本公开不限于此,例如,兴趣点的决策树属性还可以包括兴趣点的核心词、经营范围等等。通常,地图中的兴趣点及关于其多个决策树属性是相关联地存储在电子地图数据库中的,因此,在获取地图中的兴趣点时可以相应地获取到该兴趣点的多个决策树属性。构建决策树的关键在于选取决策树的根节点、非叶节点对应的各个决策树属性。通常这些属性是从最重要到次重要依次排序的,以对应到决策树的各个层级的节点的。在构建决策树的根节点时,可以通过将兴趣点的每个决策树属性分别作为根节点、其他各个决策树属性分别作为父节点和子节点,利用已经标注好的训练数据进行测试,从而选取能够使决策树的决策结果最优的决策树属性作为根节点。例如,如果将A决策树属性作为根节点获得的决策结果要大于B决策树属性作为根节点获得的决策结果,则选取A决策树属性作为根节点。根据本专利技术的实施例,例如可以利用训练数据进行多次测试,来确定决策树的各层节点。根据本专利技术的另一个实施例,也可以通过深度学习对所构建的决策树进行训练,从而对决策树的各级节点对应的决策树属性进行调整,以使得最终决策树的结构在用于确定兴趣点之间的相似度的情况下最优。根据本专利技术的实施例,通过对决策树模型的不断优化,优选将兴趣点的名称作为所述决策树的根节点属性,将兴趣点的联系方式、兴趣点的地址、兴趣点的坐标、兴趣点的分支作为所述决策树的分支节点属性。图2示出了根据本专利技术实施例的一种决策树的示例性结构。如图2所示,决策树的根节点属性为兴趣点的名称,决策树的第一级分支节点属性为兴趣点的联系方式(例如,电话)、决策树的第二级分支节点属性为兴趣点的地址,决策树的第三级分支节点属性为兴趣点的坐标。根据本专利技术的一个实施例,在构建了决策树之后,在步骤S101,获取地图中的多个兴趣点作为待去重兴趣点集合,并且获取所述待去重兴趣点集合中每个兴趣点的多个决策树属性。根据本专利技术的一个实施例,获取地图中多个兴趣点例如可以依据用户的检索请求,从电子地图数据库中检索到的与该检索请求相对应的检索结果中所包括的多个兴趣点,从而针对检索结果中包括的多个兴趣点进行去重。根据本专利技术的另一个实施例,也可以从电子地图数据库获取本文档来自技高网...
信息处理方法及装置、终端设备及计算机可读存储介质

【技术保护点】
一种用于对地图中的兴趣点进行去重的信息处理方法,其特征在于,包括以下步骤:获取地图中的多个兴趣点作为待去重兴趣点集合,并且获取所述待去重兴趣点集合中每个兴趣点的多个决策树属性;确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度;以及利用预先根据兴趣点的决策树属性构建的决策树,基于所述两个兴趣点之间的每个决策树属性的相似度来确定所述两个兴趣点是否相同,从而对所述待去重兴趣点集合中的兴趣点进行去重。

【技术特征摘要】
1.一种用于对地图中的兴趣点进行去重的信息处理方法,其特征在于,包括以下步骤:获取地图中的多个兴趣点作为待去重兴趣点集合,并且获取所述待去重兴趣点集合中每个兴趣点的多个决策树属性;确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度;以及利用预先根据兴趣点的决策树属性构建的决策树,基于所述两个兴趣点之间的每个决策树属性的相似度来确定所述两个兴趣点是否相同,从而对所述待去重兴趣点集合中的兴趣点进行去重。2.根据权利要求1所述的信息处理方法,其特征在于,所述兴趣点的决策树属性包括:兴趣点的名称、兴趣点的地址、兴趣点的电话、兴趣点的坐标以及兴趣点的分支至少其中两个。3.根据权利要求2所述的信息处理方法,其特征在于,根据所述兴趣点的决策树属性构建决策树包括:将所述兴趣点的名称作为所述决策树的根节点属性。4.根据权利要求3所述的信息处理方法,其特征在于,所述确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度包括:对所述两个兴趣点的名称进行文本分割,以提取所述兴趣点的名称中的行政区信息、核心词信息、经营范围信息以及后缀信息中的至少一个;以及基于所提取的信息,确定所述两个兴趣点之间的名称属性的相似度。5.根据权利要求3所述的信息处理方法,其特征在于,根据所述兴趣点的决策树属性构建决策树还包括:将所述兴趣点的地址作为所述决策树的分支节点属性。6.根据权利要求5所述的信息处理方法,其特征在于,所述确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度包括:对所述两个兴趣点的地址进行文本分割,以提取所述兴趣点的地址中的行政区信息、道路名称信息、道路后缀信息、区域号码信息、区域名称信息中的至少一个;以及基于所提取的信息,确定所述两个兴趣点之间的地址属性的相似度。7.根据权利要求3所述的信息处理方法,其特征在于,根据所述兴趣点的决策树属性构建决策树还包括:将所述兴趣点的坐标作为所述决策树的分支节点属性。8.根据权利要求7所述的信息处理方法,其特征在于,所述确定所述去重兴趣点集合中任意两个兴趣点之间的每个决策树属性的相似度包括:基于所述两个兴趣点的坐标,计算所述...

【专利技术属性】
技术研发人员:谢红伟刘珊珊
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1