一种地址聚合的方法、包裹聚合的方法以及设备技术

技术编号:19934064 阅读:29 留言:0更新日期:2018-12-29 04:30
本申请实施例公开了一种地址聚合的方法、包裹聚合的方法以及设备,涉及数据处理技术领域。所述地址聚合的设备包括:门址获取装置,用于获取全国范围内的多个标准门址;地址转化装置,用于将多个标准门址转化为多个结构化地址;特征提取装置,用于对所述多个结构化地址进行特征提取,得到与所述多个标准门址对应的多个特征集合;相似度确定装置,用于根据所述多个标准门址对应的多个特征集合确定所述多个标准门址中任意两个标准门址之间的相似度;地址聚合装置,用于根据所述相似度将所述多个标准门址进行聚合,得到多个簇。利用本申请实施例,实现了将属于同一区域的标准门址聚合到同一簇下,以便后续提升包裹聚合的效率。

【技术实现步骤摘要】
一种地址聚合的方法、包裹聚合的方法以及设备
本申请涉及数据处理
,尤其涉及一种地址聚合的方法、包裹聚合的方法、地址聚合的设置以及包裹聚合的设备。
技术介绍
目前,在物流末端的揽派场景中,每个快递员的揽派范围一般包括多个小区或多个写字楼。现有技术中,一般按照各个包裹的收货地址首先人工手动将属于同一小区或同一写字楼的包裹进行分拣,然后按照不同的小区或写字楼一并处理,如将同一个小区的包裹批量通知用户,或者将同一个小区的包裹批量投入自提柜,将同一个小区的包裹一起派给某一个快递员逐个进行派送。随着物流行业和地理信息技术的飞速发展,人们对于物流派送的时效性的需求越来越高,上述物流末端的派送方式无法满足高速派送的需求。现有技术中物流末端的揽派场景中通过人工手动对包裹进行分拣,存在派送效率低、降低了用户体验的缺陷,且存在一定的分拣误差,会进一步降低配送效率。因此,如何研究和开发出一种新的方案,其能够对包裹进行聚合,识别出不同的包裹是否属于同一个小区、写字楼等区域,在物流末端的揽派场景通过聚合结果对包裹进行自动化分拣是本领域亟待解决的技术难题。
技术实现思路
本申请实施例的目的是提供一种地址聚合的方本文档来自技高网...

【技术保护点】
1.一种地址聚合的方法,其特征在于,所述方法包括:获取多个标准门址;将所述多个标准门址转化为多个结构化地址;对所述多个结构化地址进行特征提取,得到与所述多个标准门址对应的多个特征集合,所述特征集合包括兴趣区域属性信息;根据所述多个标准门址对应的多个特征集合确定所述多个标准门址中任意两个标准门址之间的相似度;根据所述相似度将所述多个标准门址进行聚合,得到多个簇。

【技术特征摘要】
1.一种地址聚合的方法,其特征在于,所述方法包括:获取多个标准门址;将所述多个标准门址转化为多个结构化地址;对所述多个结构化地址进行特征提取,得到与所述多个标准门址对应的多个特征集合,所述特征集合包括兴趣区域属性信息;根据所述多个标准门址对应的多个特征集合确定所述多个标准门址中任意两个标准门址之间的相似度;根据所述相似度将所述多个标准门址进行聚合,得到多个簇。2.根据权利要求1所述的方法,其特征在于,将多个标准门址转化为多个结构化地址包括:提取所述标准门址中的地名信息;为每个所述地名信息加注语义标注信息,所述语义标注信息至少包括兴趣区域的道路及路号信息和/或兴趣区域的名字;依据所述语义标注信息将所述地名信息放入结构化模板中,得到结构化地址。3.根据权利要求1所述的方法,其特征在于,根据所述相似度将所述多个标准门址进行聚合,得到多个簇包括:确定每个标准门址的相似标准门址;判断每个标准门址以及对应的相似标准门址是否在簇中;当判断为否时,将所述标准门址以及对应的相似标准门址加入到一新建的簇中;否则,将所述标准门址以及对应的相似标准门址加入所述簇中;将所述新建的簇以及所述簇作为聚合后得到的多个簇。4.根据权利要求3所述的方法,其特征在于,对所述多个结构化地址进行特征提取,得到与所述多个标准门址对应的多个特征集合包括:通过基于模板的N元模型对所述结构化地址进行特征提取,所述N元模型包括歧义度等级,提取得到的所述标准门址对应的特征集合中的多个特征对应的歧义度为所述N元模型的歧义度。5.根据权利要求4所述的方法,其特征在于,根据所述多个标准门址对应的多个特征集合确定所述多个标准门址中任意两个标准门址之间的相似度包括:通过相似度公式确定所述多个标准门址中任意两个标准门址之间的相似度。6.根据权利要求5所述的方法,其特征在于,所述确定每个标准门址的相似标准门址包括:当两个标准门址对应的特征集合中存在相同的特征且所述相同的特征的歧义度等级为无歧义;或当两个标准门址之间的相似度不小于一预设阈值;或当两个标准门址对应的特征集合中存在同义的兴趣区域时,将所述两个标准门址作为相似标准门址。7.根据权利要求3至6任意一项所述的方法,其特征在于,所述兴趣区域属性信息包括兴趣区域的道路及路号信息和/或兴趣区域的名字,所述方法还包括对所述多个簇进行命名,得到所述簇的名称。8.根据权利要求7所述的方法,其特征在于,所述簇的名称包括簇ID,所述方法还包括:获取组成所述簇的多个标准门址对应的多个特征集合;将所述特征集合中的特征关联所述簇ID;根据所述簇ID创建倒排索引,形成包裹聚合模型,所述包裹聚合模型为文本模型。9.根据权利要求7所述的方法,其特征在于,所述簇的名称包括簇ID,所述方法还包括:获取组成所述簇的多个标准门址,所述标准门址包括标准地址以及与所述标准地址对应的经纬度;将所述多个标准门址关联所述簇ID;根据所述多个标准门址包括的多个经纬度确定兴趣区域的中心点以及边界;根据所述兴趣区域的中心点以及边界建立兴趣区域的多边形;在所述多边形中建立网格;建立所述网格与所述簇ID的映射关系,形成包裹聚合模型,所述包裹聚合模型为经纬度模型。10.根据权利要求8或9任意一项所述的方法,其特征在于,所述方法还包括:获取包裹的通信地址;将所述通信地址与所述包裹聚合模型进行匹配,得到与所述包裹对应的簇;将所述包裹聚合在所述簇下。11.根据权利要求10所述的方法,其特征在于,对所述多个簇进行命名包括:获取组成所述簇的多个标准门址对应的特征集合;根据所述特征集合依次确定每个道路及路号信息的频次以及区域名称的频次;将频次最高的特征作为所述簇的名称。12.根据权利要求10所述的方法,其特征在于,对所述多个簇进行命名包括:获取组成所述簇的多个标准门址对应的特征集合;从所述特征集合中筛选出多个区域名称;将实际使用频率最高的区域名称作为所述簇的名称。13.一种包裹聚合的方法,其特征在于,所述方法包括:获取多个标准门址;确定所述多个标准门址中任意两个标准门址之间的相似度,根据所述相似度将所述多个标准门址进行聚合,得到多个簇;分别为所述多个簇创建包裹聚合模型;获取包裹的通信地址,将所述通信地址与所述包裹聚合模型进行匹配,得到与所述包裹对应的簇,将所述包裹聚合在所述簇下。14.根据权利要求13所述的方法,其特征在于,确定所述多个标准门址中任意两个标准门址之间的相似度包括:将所述多个标准门址转化为多个结构化地址;对所述多个结构化地址进行特征提取,得到与所述多个标准门址对应的多个特征集合,所述特征集合中包括兴趣区域属性信息;根据所述多个标准门址对应的多个特征集合确定所述多个标准门址中任意两个标准门址之间的相似度。15.根据权利要求13所述的方法,其特征在于,所述方法还包括:对所述多个簇进行命名,得到所述簇的名称,所述簇的名称包括簇ID。16.根据权利要求15所述的方法,其特征在于,分别为所述多个簇创建包裹聚合模型包括:获取组成所述簇的多个标准门址对应的多个特征集合;将所述特征集合中的特征关联所述簇ID;根据所述簇ID创建倒排索引,形成包裹聚合模型,所述包裹聚合模型为文本模型。17.根据权利要求15所述的方法,其特征在于,分别为所述多个簇创建包裹聚合模型包括:获取组成所述簇的多个标准门址,所述标准门址包括标准地址以及与所述标准地址对应的经纬度;将所述多个标准门址关联所述簇ID;根据所述多个标准门址包括的多个经纬度确定兴趣区域的中心点以及边界;根据所述兴趣区域的中心点以及边界建立兴趣区域的多边形;在所述多边形中建立网格;建立所述网格与所述簇ID的映射关系,形成包裹聚合模型,所述包裹聚合模型为经纬度模型。18.一种地址聚合的设备,其特征在于,所述设备包括:门址获取装置,用于获取多个标准门址;地址转化装置,用于将多个标准门址转化为多个结构化地址;特征提取装置,用于对所述多个结构化地址进行特征提取,得到与所述多个标准门址对应的多个特征集合,所述特征集合包括兴趣区域属性信息;...

【专利技术属性】
技术研发人员:王国印郑耸
申请(专利权)人:菜鸟智能物流控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1