基于运单的兴趣点失效挖掘方法、装置、服务器及介质制造方法及图纸

技术编号:17304578 阅读:19 留言:0更新日期:2018-02-18 22:45
本发明专利技术实施例公开了一种基于运单的兴趣点失效挖掘方法、装置、服务器及存储介质。所述方法包括:依据快递运单数据中的地址信息,确定兴趣点关联的快递运单;将所述兴趣点关联的快递运单的生成时间添加到所述兴趣点的校验时间序列中;依据所述兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点。本发明专利技术实施例提高了兴趣点失效挖掘的效率,并且降低了确定失效兴趣点的投入成本,从而提高了兴趣点的空间位置准确率和时效性。

Interest point failure mining methods, devices, servers and media based on waybill

An embodiment of the invention discloses an interest point failure mining method based on a waybill, a device, a server and a storage medium. The method comprises the following steps: according to the address information courier waybill data, identify points of interest associated courier waybill; time will generate the points of interest associated with the courier waybill added to check the time sequence of the points of interest; according to the check time sequence of the points of interest, to determine the point of interest is a failure points of interest. The embodiment of the invention improves the efficiency of the interest point failure mining, and reduces the input cost of determining the invalid interest point, thereby improving the location accuracy and timeliness of interest points.

【技术实现步骤摘要】
基于运单的兴趣点失效挖掘方法、装置、服务器及介质
本专利技术实施例涉及数据挖掘技术,尤其涉及一种基于运单的兴趣点失效挖掘方法、装置、服务器及介质。
技术介绍
随着互联网的飞速发展,各种LBS(LocationBasedService,基于位置的服务)产品及电子地图的客户端应用给人们的日常生活带来了极大的方便,而衡量这些产品及应用一个重要指标就是兴趣点(PointofInterest,POI)的空间位置准确率。兴趣点失效是影响兴趣点的空间位置准确率的重要因素。目前,电子地图中存在很多兴趣点状态与现实世界不符,例如某些商户已经搬迁、停业等,但是此兴趣点的状态依然没有改变,误导用户对现实世界的认知,给用户造成极大的不便。然而,现有技术中主要是通过人工采集的方式挖掘失效的兴趣点,投入成本大,时效性差,不能及时准确的提供兴趣点信息给用户。
技术实现思路
本专利技术实施例提供一种基于运单的兴趣点失效挖掘方法、装置、服务器及介质,可以提高兴趣点失效挖掘的效率,并且降低确定失效兴趣点的投入成本。第一方面,本专利技术实施例提供了一种基于运单的兴趣点失效挖掘方法。包括:依据快递运单数据中的地址信息,确定兴趣点关联的快递运单;将所述兴趣点关联的快递运单的生成时间添加到所述兴趣点的校验时间序列中;依据所述兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点。第二方面,本专利技术实施例还提供了一种基于运单的兴趣点失效挖掘装置,该装置包括:兴趣点运单模块,用于依据快递运单数据中的地址信息,确定兴趣点关联的快递运单;校验时间模块,用于将所述兴趣点关联的快递运单的生成时间添加到所述兴趣点的校验时间序列中;失效兴趣点模块,用于依据所述兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点。第三方面,本专利技术实施例还提供了一种服务器,所述服务器包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的基于运单的兴趣点失效挖掘方法。第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的基于运单的兴趣点失效挖掘方法。本专利技术实施例通过快递运单数据中的地址信息,确定兴趣点关联的快递运单,并将兴趣点关联的快递运单的生成时间添加到兴趣点的校验时间序列中,然后依据兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点。由于兴趣点是与快递运单信息关联的,通过快递运单的时间序列变化来挖掘其关联的兴趣点的失效情况,提高了兴趣点失效挖掘的效率,并且降低了确定失效兴趣点的投入成本,进而提高了兴趣点的空间位置准确率和时效性。附图说明图1为本专利技术实施例一中的基于运单的兴趣点失效挖掘方法的流程图;图2为本专利技术实施例二中的基于运单的兴趣点失效挖掘方法的流程图;图3为本专利技术实施例三中的基于运单的兴趣点失效挖掘装置的结构示意图;图4为本专利技术实施例四中的服务器的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一中的基于运单的兴趣点失效挖掘方法的流程图,本实施例可适用于兴趣点失效挖掘的情况,该方法可以由基于运单的兴趣点失效挖掘装置来执行,该装置可以采用软件和/或硬件的方式实现,例如,该装置可配置于服务器中。如图1所示,该方法具体可以包括:S11、依据快递运单数据中的地址信息,确定兴趣点关联的快递运单。在本实施例中,可以通过地理编码系统的日志获取快递运单数据,快递运单数据中的地址信息是指收货地址和发货地址,例如:北京市海淀区上地信息路X号。所述兴趣点是理信息系统中的一个术语,泛指一切可以抽象为点的地理对象,尤其是一些与人们生活密切相关的地理实体,如学校、银行、餐馆、加油站、医院、超市等。兴趣点的主要用途是对事物或事件的地址进行描述,能在很大程度上增强对事物或事件位置的描述能力和查询能力,提高地理定位的精度和速度。具体的,根据快递运单数据上的地址信息获取该地址信息附近所有的兴趣点,若附近的兴趣点在快递运单中出现,则将该快递运单作为该兴趣点关联的快递运单。S12、将所述兴趣点关联的快递运单的生成时间添加到所述兴趣点的校验时间序列中。其中,所述兴趣点关联的快递运单的生成时间是指将快递运单数据录入地理编码系统的时间。所述兴趣点的校验时间序列用于存储兴趣点关联的各快递运单的生成时间,例如在预设时间段内某兴趣点关联有快递运单A,B和C,则该兴趣点的校验时间序列中包括快递运单A,B和C的生成时间TA,TB和TC。需要说明的是,校验时间序列中包含的各快递运单的生成时间可以按照时间先后顺序进行排序,如时间在前的排序在前。后续依据兴趣点的校验时间序列确定兴趣点是否失效。S13、依据所述兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点。具体的,可以依据兴趣点的校验时间序列中包括的各时间,确定兴趣点收发快递的热度,进而可以依据收发快递的热度确定兴趣点是否为失效兴趣点。本实施例通过快递运单数据中的地址信息,确定兴趣点关联的快递运单,并将兴趣点关联的快递运单的生成时间添加到兴趣点的校验时间序列中,然后依据兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点。由于兴趣点是与快递运单的地址信息关联的,通过快递运单的时间序列变化来挖掘其关联的兴趣点的失效情况,提高了兴趣点失效挖掘的效率,并且降低了确定失效兴趣点的投入成本,从而提高了兴趣点的空间位置准确率和时效性。实施例二图2为本专利技术实施例二中的基于运单的兴趣点失效挖掘方法的流程图。本实施例在上述实施例的基础上,进一步优化了上述基于运单的兴趣点失效挖掘方法。相应的,如图2所示,本实施例的方法具体包括:S21、通过提取并解析所述快递运单数据中的地址信息,确定所述地址信息对应的坐标。在本实施例中,对快递运单数据中的地址信息进行语义理解和拆分,对语法级别进行分词直到得到最精细的地址,即最小单位地址。例如:快递运单的地址为北京市海淀区A大学,确定的最小单位地址为A大学。S22、将所述地址信息与所述坐标所在区域中包含的至少一个兴趣点进行匹配;若匹配成功,则作为匹配成功的兴趣点的快递运单。其中,所述坐标所在区域为该坐标附近,具体区域的大小可以根据情况设定,例如:2公里以内。获取该坐标附近所有的兴趣点的名称,将这些兴趣点与上述快递运单地址信息进行一一匹配,在匹配过程中主要分析该兴趣点名称是否在运单地址中出现。若出现,则确定该兴趣点匹配成功,对应的快递运单为匹配成功的运单。示例性的,若快递运单的地址为:北京市海淀区A大学,先获取A大学2公里以内的所有兴趣点的名称,若存在名称为A大学的兴趣点,则确定匹配成功,并将该快递运单确定为A大学关联的快递运单。S23、将所述兴趣点关联的快递运单的生成时间添加到所述兴趣点的校验时间序列中。其中,所述兴趣点关联的快递运单为上述匹配成功的快递运单,记录快递运单的地址信息在地理编码系统的日志中出现的生成时间。累计一段时间,确定兴趣点关联的各快递运单,并将各快递运单的生成时间添加到兴趣点的校验时间序列中。将该生成时间本文档来自技高网...
基于运单的兴趣点失效挖掘方法、装置、服务器及介质

【技术保护点】
一种基于运单的兴趣点失效挖掘方法,其特征在于,包括:依据快递运单数据中的地址信息,确定兴趣点关联的快递运单;将所述兴趣点关联的快递运单的生成时间添加到所述兴趣点的校验时间序列中;依据所述兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点。

【技术特征摘要】
1.一种基于运单的兴趣点失效挖掘方法,其特征在于,包括:依据快递运单数据中的地址信息,确定兴趣点关联的快递运单;将所述兴趣点关联的快递运单的生成时间添加到所述兴趣点的校验时间序列中;依据所述兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点。2.根据权利要求1所述的方法,其特征在于,所述依据快递运单数据中的地址信息,确定兴趣点关联的快递运单,包括:通过提取并解析所述快递运单数据中的地址信息,确定所述地址信息对应的坐标;将所述地址信息与所述坐标所在区域中包含的至少一个兴趣点进行匹配;若匹配成功,则作为匹配成功的兴趣点的快递运单。3.根据权利要求1所述的方法,其特征在于,所述依据所述兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点,包括:依据所述兴趣点的校验时间序列,确定所述兴趣点是否满足如下条件:所述兴趣点存在连续第一时间长度,且平均间隔不超过第二时间长度的快递运单;以及所述兴趣点在最近的第三时间长度内没有关联的快递运单,其中所述第一时间长度大于所述第三时间长度,所述第三时间长度大于所述第二时间长度;若满足,则确定所述兴趣点是失效兴趣点。4.根据权利要求1所述的方法,其特征在于,所述依据所述兴趣点的校验时间序列,确定所述兴趣点是否为失效兴趣点之前,还包括:依据用户对兴趣点的反馈验证操作,对兴趣点进行筛选。5.一种基于运单的兴趣点失效挖掘装置,其特征在于,包括:兴趣点运单模块,用于依据快递运单数据中的地址信息,确定兴趣点关联的快递运单;校验时间模块,用于将所述兴趣点关联的快递运单的生成时间添加到所述兴趣点...

【专利技术属性】
技术研发人员:王海南宋宽
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1