POI数据挖掘、信息检索方法、装置、设备及介质制造方法及图纸

技术编号:16837616 阅读:39 留言:0更新日期:2017-12-19 20:03
本发明专利技术实施例公开了一种POI数据挖掘、信息检索方法、装置、设备及介质。该POI数据的挖掘方法,包括:在目标网站中抓取原始公司信息,其中,公司信息包括公司名称以及公司地址;根据原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息;将有效公司地址,与有效公司地址对应的公司名称和地理位置信息存储于一条公司POI数据中;根据用户的历史点击日志,对各公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称。上述方法为用户进行公司导航提供了极大的便利,同时满足了用户对公司导航由于表达习惯不同而产生的不同需求。

POI data mining, information retrieval methods, devices, equipment, and media

The embodiment of the invention discloses a POI data mining, information retrieval method, device, equipment and medium. Including the POI data mining method: grab the original company information in the target site, company information including company name and address of the company; according to the original company information in the address of the company, to determine the effective address and location information. And the corresponding effective company; company will effectively address, corresponding to the effective company the address of the company name and location information stored in the POI data of a company; according to the user's click history log, the POI data of each company in the name of the company for the company referred to Target Corp POI data mining, and referred to in mine company, the company referred to join. The above methods provide a great convenience for users to navigate the company, and satisfy users' different needs for company navigation because of different expression habits.

【技术实现步骤摘要】
POI数据挖掘、信息检索方法、装置、设备及介质
本专利技术实施例涉及数据处理
,尤其涉及一种POI数据挖掘、信息检索方法、装置、设备及存储介质。
技术介绍
车载导航是利用车载GPS(GlobalPositioningSystem,全球定位系统)配合电子地图来进行的,它能方便且准确地告诉驾驶者去往目的地的最短或者最快路径。当商户客户需要到其合作公司进行商务洽谈时,通常会进行公司地址的导航。但是,电子地图的POI(PointofInformation,信息点)检索对公司导航的支持度较差,特别是对于一些中小型企业,由于其知名度不足、曝光度不高等原因不一定会被百度地图收录。因此,当用户的公司导航需求得不到满足时,会直接影响用户对车载导航的体验效果。
技术实现思路
本专利技术实施例提供一种POI数据挖掘、信息检索方法、装置、设备及存储介质,以解决电子地图的POI检索对公司导航支持度比较差的问题。第一方面,本专利技术实施例提供了一种POI数据的挖掘方法,包括:在目标网站中抓取原始公司信息,其中,所述公司信息包括公司名称以及公司地址;根据所述原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息;将所述有效公司地址,与所述有效公司地址对应的公司名称,以及与所述有效公司地址对应的地理位置信息存储于一条公司POI数据中;根据用户的历史点击日志,对各所述公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称。第二方面,本专利技术实施例还提供了一种信息检索方法,包括:通过车载导航系统获取用户输入的路径导航请求,并提取所述路径导航请求中包括的目的地信息;获取预先存储的公司POI数据,其中,所述公司POI数据通过本专利技术任意实施例所述的公司POI数据的挖掘方法生成;如果确定所述公司POI数据中包括所述目的地信息,则获取与所述目的地信息对应的地理位置信息;根据查询得到的所述地理位置信息进行路径规划。第三方面,本专利技术实施例还提供了一种POI数据的挖掘装置,包括:信息抓取模块,用于在目标网站中抓取原始公司信息,其中,所述公司信息包括公司名称以及公司地址;信息确定模块,用于根据所述原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息;信息存储模块,用于将所述有效公司地址,与所述有效公司地址对应的公司名称以及地理位置信息存储于一条公司POI数据中;简称挖掘模块,用于根据用户的历史点击日志,对各所述公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称。第四方面,本专利技术实施例还提供了一种信息检索装置,包括:信息提取模块,用于通过车载导航系统获取用户输入的路径导航请求,并提取所述路径导航请求中包括的目的地信息;数据获取模块,用于获取预先存储的公司POI数据,其中,所述公司POI数据通过本专利技术任意实施例所述的公司POI数据的挖掘方法生成;第一位置信息获取模块,用于如果确定所述公司POI数据中包括所述目的地信息,则获取与所述目的地信息对应的地理位置信息;路径规划模块,用于根据查询得到的所述地理位置信息进行路径规划。第五方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本专利技术任意实施例所述的POI数据的挖掘方法。第六方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任意实施例所述的POI数据的挖掘方法。第七方面,本专利技术实施例还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本专利技术任意实施例所述的信息检索方法。第八方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本专利技术任意实施例所述的信息检索方法。本专利技术实施例提供的一种POI数据挖掘、信息检索方法、装置、设备及存储介质,该POI数据的挖掘方法通过在目标网站中抓取原始公司信息;根据原始公司信息中的公司地址,确定有效公司地址及与之对应的地理位置信息;将有效公司地址、与之对应的公司名称、地理位置信息存储于一条公司POI数据中;根据用户的历史点击日志,对各公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称的技术手段,解决了现有的电子地图的POI检索对公司导航支持度较差的问题,通过挖掘公司POI数据,建立了公司POI导航数据库,为用户进行公司导航提供了极大的便利,通过在公司POI导航数据库加入公司的简称,满足了用户对公司导航由于表达习惯不同而产生的不同需求。附图说明图1是本专利技术实施例一中的一种POI数据的挖掘方法的流程图;图2是本专利技术实施例二中的一种POI数据的挖掘方法的流程图;图3是本专利技术实施例三中的一种POI数据的挖掘方法的流程图;图4是本专利技术实施例四中的一种信息检索方法的流程图;图5是本专利技术实施例五中的一种POI数据的挖掘装置的结构示意图;图6是本专利技术实施例六中的一种信息检索装置的结构示意图;图7是本专利技术实施例七中的一种计算机设备的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。实施例一本实施例提供了一种POI数据的挖掘方法,可适用于对公司的POI数据(例如:由公司名称、公司地址以及地理位置信息构成的POI数据,或者由公司名称、公司地址、公司简称以及地理位置信息构成的POI信息)进行挖掘的情况,该方法可以由本专利技术实施例提供的POI数据的挖掘装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在导航服务器中。如图1所示,本实施例的方法具体包括下述操作:S110、在目标网站中抓取原始公司信息。其中,公司信息包括公司名称以及公司地址。原始公司信息通常可以在包含有大量公司信息的目标网站中进行获取,其中,目标网站例如可以是招聘网站,大多数公司都在会招聘网站是公布其招聘信息,尤其是一些中小型公司,而招聘信息中通常会包括公司的详细信息,例如公司名称和公司地址等等。S120、根据原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息。目标网站的原始公司信息是多种多样的,不乏一些虚假招聘信息或者无效的公司信息,因此需要对原始公司信息进行筛选,筛除出无效的原始公司信息后,确定其中有效的公司地址及其对应的地理位置本文档来自技高网...
POI数据挖掘、信息检索方法、装置、设备及介质

【技术保护点】
一种POI数据的挖掘方法,其特征在于,包括:在目标网站中抓取原始公司信息,其中,所述公司信息包括公司名称以及公司地址;根据所述原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息;将所述有效公司地址,与所述有效公司地址对应的公司名称,以及与所述有效公司地址对应的地理位置信息存储于一条公司POI数据中;根据用户的历史点击日志,对各所述公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称。

【技术特征摘要】
1.一种POI数据的挖掘方法,其特征在于,包括:在目标网站中抓取原始公司信息,其中,所述公司信息包括公司名称以及公司地址;根据所述原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息;将所述有效公司地址,与所述有效公司地址对应的公司名称,以及与所述有效公司地址对应的地理位置信息存储于一条公司POI数据中;根据用户的历史点击日志,对各所述公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称。2.根据权利要求1所述的方法,其特征在于,根据所述原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息,包括:分别将各所述原始公司信息中的公司地址输入至设定地图接口中,获取所述设定地图接口返回的,与各所述公司地址对应的地址置信度以及地理位置信息;将地址置信度超过设定第一阈值的公司地址作为所述有效公司地址,并获取与所述有效公司地址对应的地理位置信息。3.根据权利要求2所述的方法,其特征在于,在分别将各所述原始公司信息中的公司地址输入至设定地图接口中,获取所述设定地图接口返回的,与各所述公司地址对应的地址置信度以及地理位置信息之前,还包括:根据第一筛选规则,筛除所述原始公司信息中包括的无效公司信息。4.根据权利要求1所述的方法,其特征在于,在将所述有效公司地址,与所述有效公司地址对应的公司名称,以及与所述有效公司地址对应的地理位置信息存储于一条公司POI数据中之后,还包括:获取第一用户搜索日志,并在所述第一用户搜索日志的用户查询式中,统计各公司POI数据中的公司地址的出现次数,和/或各公司POI数据中的公司名称的出现次数;将所述公司地址的出现次数,和/或所述公司名称的出现次数大于第二阈值的公司POI数据进行滤除。5.根据权利要求1所述的方法,其特征在于,根据用户的历史点击日志,对各所述公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称,包括:依次获取一条公司POI数据作为当前操作公司数据;根据用户的历史点击日志,获取查询式中包括所述当前操作公司数据中的当前操作公司名称的目标点击日志,和/或查询式中包括所述当前操作公司数据中的当前操作公司地址的目标点击日志;根据与所述目标点击日志对应的至少一个点击网站,确定目标高频点击网站集合;将所述目标高频点击网站集合与各备选查询式的备选高频点击网站集合进行匹配,获取满足匹配条件的目标备选查询式,其中,各备选查询式的备选高频点击网站集合由所述用户的历史点击日志确定;分别计算各个目标备选查询式与所述当前操作公司名称的相似度,并将相似度大于设定第三阈值的目标备选查询式作为所述当前操作公司名称的公司简称;返回执行依次获取一条公司POI数据作为当前操作公司数据,直至完成对全部公司POI数据的处理。6.根据权利要求5所述的方法,其特征在于,在完成对全部...

【专利技术属性】
技术研发人员:谢泽颖凌光林英展周超
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1