The embodiment of the invention discloses a POI data mining, information retrieval method, device, equipment and medium. Including the POI data mining method: grab the original company information in the target site, company information including company name and address of the company; according to the original company information in the address of the company, to determine the effective address and location information. And the corresponding effective company; company will effectively address, corresponding to the effective company the address of the company name and location information stored in the POI data of a company; according to the user's click history log, the POI data of each company in the name of the company for the company referred to Target Corp POI data mining, and referred to in mine company, the company referred to join. The above methods provide a great convenience for users to navigate the company, and satisfy users' different needs for company navigation because of different expression habits.
【技术实现步骤摘要】
POI数据挖掘、信息检索方法、装置、设备及介质
本专利技术实施例涉及数据处理
,尤其涉及一种POI数据挖掘、信息检索方法、装置、设备及存储介质。
技术介绍
车载导航是利用车载GPS(GlobalPositioningSystem,全球定位系统)配合电子地图来进行的,它能方便且准确地告诉驾驶者去往目的地的最短或者最快路径。当商户客户需要到其合作公司进行商务洽谈时,通常会进行公司地址的导航。但是,电子地图的POI(PointofInformation,信息点)检索对公司导航的支持度较差,特别是对于一些中小型企业,由于其知名度不足、曝光度不高等原因不一定会被百度地图收录。因此,当用户的公司导航需求得不到满足时,会直接影响用户对车载导航的体验效果。
技术实现思路
本专利技术实施例提供一种POI数据挖掘、信息检索方法、装置、设备及存储介质,以解决电子地图的POI检索对公司导航支持度比较差的问题。第一方面,本专利技术实施例提供了一种POI数据的挖掘方法,包括:在目标网站中抓取原始公司信息,其中,所述公司信息包括公司名称以及公司地址;根据所述原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息;将所述有效公司地址,与所述有效公司地址对应的公司名称,以及与所述有效公司地址对应的地理位置信息存储于一条公司POI数据中;根据用户的历史点击日志,对各所述公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称。第二方面,本专利技术实施例还提供了一种信息检索方法,包括:通过车载导航系统获取用户输入的路 ...
【技术保护点】
一种POI数据的挖掘方法,其特征在于,包括:在目标网站中抓取原始公司信息,其中,所述公司信息包括公司名称以及公司地址;根据所述原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息;将所述有效公司地址,与所述有效公司地址对应的公司名称,以及与所述有效公司地址对应的地理位置信息存储于一条公司POI数据中;根据用户的历史点击日志,对各所述公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称。
【技术特征摘要】
1.一种POI数据的挖掘方法,其特征在于,包括:在目标网站中抓取原始公司信息,其中,所述公司信息包括公司名称以及公司地址;根据所述原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息;将所述有效公司地址,与所述有效公司地址对应的公司名称,以及与所述有效公司地址对应的地理位置信息存储于一条公司POI数据中;根据用户的历史点击日志,对各所述公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称。2.根据权利要求1所述的方法,其特征在于,根据所述原始公司信息中的公司地址,确定有效公司地址以及与所述有效公司地址对应的地理位置信息,包括:分别将各所述原始公司信息中的公司地址输入至设定地图接口中,获取所述设定地图接口返回的,与各所述公司地址对应的地址置信度以及地理位置信息;将地址置信度超过设定第一阈值的公司地址作为所述有效公司地址,并获取与所述有效公司地址对应的地理位置信息。3.根据权利要求2所述的方法,其特征在于,在分别将各所述原始公司信息中的公司地址输入至设定地图接口中,获取所述设定地图接口返回的,与各所述公司地址对应的地址置信度以及地理位置信息之前,还包括:根据第一筛选规则,筛除所述原始公司信息中包括的无效公司信息。4.根据权利要求1所述的方法,其特征在于,在将所述有效公司地址,与所述有效公司地址对应的公司名称,以及与所述有效公司地址对应的地理位置信息存储于一条公司POI数据中之后,还包括:获取第一用户搜索日志,并在所述第一用户搜索日志的用户查询式中,统计各公司POI数据中的公司地址的出现次数,和/或各公司POI数据中的公司名称的出现次数;将所述公司地址的出现次数,和/或所述公司名称的出现次数大于第二阈值的公司POI数据进行滤除。5.根据权利要求1所述的方法,其特征在于,根据用户的历史点击日志,对各所述公司POI数据中的公司名称进行公司简称挖掘,并在挖掘出公司简称的目标公司POI数据中,加入对应的公司简称,包括:依次获取一条公司POI数据作为当前操作公司数据;根据用户的历史点击日志,获取查询式中包括所述当前操作公司数据中的当前操作公司名称的目标点击日志,和/或查询式中包括所述当前操作公司数据中的当前操作公司地址的目标点击日志;根据与所述目标点击日志对应的至少一个点击网站,确定目标高频点击网站集合;将所述目标高频点击网站集合与各备选查询式的备选高频点击网站集合进行匹配,获取满足匹配条件的目标备选查询式,其中,各备选查询式的备选高频点击网站集合由所述用户的历史点击日志确定;分别计算各个目标备选查询式与所述当前操作公司名称的相似度,并将相似度大于设定第三阈值的目标备选查询式作为所述当前操作公司名称的公司简称;返回执行依次获取一条公司POI数据作为当前操作公司数据,直至完成对全部公司POI数据的处理。6.根据权利要求5所述的方法,其特征在于,在完成对全部...
【专利技术属性】
技术研发人员:谢泽颖,凌光,林英展,周超,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。