兴趣点数据关联方法和装置制造方法及图纸

技术编号:12104613 阅读:75 留言:0更新日期:2015-09-23 23:10
本发明专利技术实施例公开了一种兴趣点数据关联方法和装置。所述方法包括:将非结构化数据与兴趣点匹配;将与所述兴趣点匹配成功的非结构化数据与所述兴趣点相关联。本发明专利技术实施例提供的兴趣点数据关联方法和装置使得兴趣点的相关数据更为丰富。

【技术实现步骤摘要】

本专利技术实施例涉及基于位置服务
,尤其涉及一种兴趣点数据关联方法和 装置。
技术介绍
现有的地图应用中,每个兴趣点都有自身的一些说明数据,比如,电话、地址等。这 些说明数据被称为兴趣点的相关数据。兴趣点的相关数据的采集都是通过对网络上结构化 数据的抓取而实现的。所谓结构化数据,就是指这些数据本身的结构有一定的规律可循。利 用这种数据结构上的规律,能够准确的抓取到所述兴趣点的相关数据。 然而,网络上更为海量的数据,其数据本身并不具有固定的格式规律。我们将这种 本身没有固定的格式规律可循的数据成为非结构化数据。所述非结构化数据中蕴含着比结 构化数据更为海量的信息。所以,现有的地图应用中,兴趣点的相关数据的数据源有限,使 得兴趣点的相关数据不够丰富。
技术实现思路
针对上述技术问题,本专利技术实施例提供了一种兴趣点数据关联方法和装置,以丰 富与兴趣点相关联的数据。 第一方面,本专利技术实施例提供了一种兴趣点数据关联方法,所述方法包括: 将非结构化数据与兴趣点匹配; 将与所述兴趣点匹配成功的非结构化数据与所述兴趣点相关联。 第二方面,本专利技术实施例还提供了一种兴趣点数据关联装置,所述装置包括: 匹配模块,用于将非结构化数据与兴趣点匹配; 关联模块,用于将与所述兴趣点匹配成功的非结构化数据与所述兴趣点相关联。 本专利技术实施例提供的兴趣点数据关联方法和装置通过将非结构化数据与兴趣点 匹配,以及将与所述兴趣点匹配成功的非结构化数据与所述兴趣点相关联,使得兴趣点的 相关数据更为丰富。【附图说明】 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它 特征、目的和优点将会变得更明显: 图1是本专利技术第一实施例提供的兴趣点数据关联方法的流程图; 图2A是本专利技术第一实施例提供的兴趣点原始数据的显示界面图; 图2B是本专利技术第一实施例提供的兴趣点的相关数据的显示界面图; 图3是本专利技术第二实施例提供的兴趣点数据关联方法的流程图; 图4是本专利技术第三实施例提供的兴趣点数据关联方法的流程图; 图5本专利技术第四实施例提供的兴趣点数据关联方法的流程图; 图6是本专利技术第四实施例提供的兴趣点数据关联方法中位置关联的流程图; 图7是本专利技术第四实施例提供的兴趣点数据关联方法中位置关联的流程图; 图8是本专利技术第五实施例提供的兴趣点数据关联方法的流程图; 图9是本专利技术第六实施例提供的兴趣点数据关联装置的结构图。【具体实施方式】 下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便 于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。 第一实施例 本实施例提供了兴趣点数据关联方法的一种技术方案。 参见图1,所述兴趣点数据关联方法包括: S11,将非结构化数据与兴趣点匹配。 所述非结构化数据是指数据自身的结构没有规律可循,也就是不能依据数据自身 的格式规律从原始数据中找到需要被关联至所述兴趣点的数据内容。与所述结构化数据的 相同点在于,通常情况下,所述非结构化数据也是从互联网上抓取得到的数据。 在本实施例中,所述非结构化数据包括内容导向的非结构化数据以及地址导向的 非结构化数据。所述内容导向的非结构化数据,是指依据所述数据的内容与所述兴趣点之 间产生内在联系的非结构化数据。所述地址导向的非结构化数据是指依据所述数据内包含 的地址与所述兴趣点之间产生内在联系的非结构化数据。其中,用于将所述地址导向的非 结构化数据与所述兴趣点产生内在联系的地址也可以被称为地点。 对于内容导向的非结构化数据,通过从所述内容导向的非结构化数据中提取的特 征向量来完成所述内容导向的非结构化数据与所述兴趣点之间的匹配。而对于地址导向的 非结构化数据,则通过从所述地址导向的非结构化数据中提取的地址,也就是地点来完成 所述非结构化数据与所述兴趣点之间的匹配。 S12,将与所述兴趣点匹配成功的非结构化数据与所述兴趣点相关联。 与所述兴趣点匹配成功的非结构化数据应该是所述非结构化数据中与所述兴趣 点之间的联系更为紧密的数据。因此,将与所述兴趣点匹配成功的非结构化数据与所述兴 趣点进彳丁关联。 对于内容导向的非结构化数据,其与所述兴趣点的关联是根据相关度、文本相似 程度以及文本召回位置三种参量进行排序之后的相关。而对于地址导向的非结构化数据, 其与所述兴趣点之间的关联是获取所述地址导向非结构化数据的地理位置之后,依据所述 地址导向非结构化数据的地理位置与所述兴趣点之间的相关。 图2A示出了需要挖掘兴趣点的相关数据的兴趣点的原始信息。图2B则示出了依 据本实施例提供的方法挖掘得到的兴趣点的相关数据。参见图2B,在兴趣点相关数据的末 尾,有从非结构化数据中挖掘得打的兴趣点的相关数据21。 本实施例通过将非结构化数据与兴趣点匹配,以及将与所述兴趣点匹配成功的非 结构化数据与所述兴趣点相关联,从而实现了从非结构化的数据中提取与兴趣点有关的数 据,并将从所述非结构化数据中提取的数据与所述兴趣点之间的关联,从而扩大了兴趣点 关联数据的数据源的选择范围,有效的丰富了兴趣点的相关数据。 第二实施例 本实施例以本专利技术上述实施例为基础,提供了兴趣点数据关联方法的一种技术方 案。在该技术方案中,将非结构化数据与所述兴趣点匹配包括:根据对所述兴趣点关联语料 的卡方检验,确定所述兴趣点的特征向量;获取与所述特征向量匹配的内容导向非结构化 数据。并且,将与所述兴趣点匹配成功的非结构化数据与所述兴趣点相关联包括:根据概率 潜在语义分析PLSA模型计算与所述特征向量匹配的内容导向非结构化数据与所述兴趣点 的特征向量之间的相似度;对相似度在预定阈值以上的所述内容导向的非结构化数据进行 过滤;根据过滤后的内容导向的非结构化数据与所述特征向量之间的相似度、文本丰富度、 文本召回位置对所述过滤后的内容导向的非结构化数据进行排序;根据所述排序的排序位 置将所述过滤后的内容导向的非结构化数据与所述兴趣点相关联。 参见图3,所述兴趣点数据关联方法包括: S31,根据对所述兴趣点关联语料的卡方检验,确定所述兴趣点的特征向量。 示例性的,所述兴趣点关联语料包括互联网上与所述兴趣点有关的评论以及与所 述兴趣点无关的评论。将与所述兴趣点有关的评论合并为一个文档,该文档被称为正文当。 然后,将与所述兴趣点无关的评当前第1页1 2 3 4 本文档来自技高网...

【技术保护点】
一种兴趣点数据关联方法,其特征在于,包括:将非结构化数据与兴趣点匹配;将与所述兴趣点匹配成功的非结构化数据与所述兴趣点相关联。

【技术特征摘要】

【专利技术属性】
技术研发人员:江章伟解鑫王彬张林
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1