The application embodiment provides a method, a device, and a system for determining the uniqueness of the address. The method comprises: a plurality of containing the same road information or interest points POI information text address access to multiple latitude coordinate based on; the plurality of latitude and longitude clustering; according to the clustering results to determine the plurality of road information contains the same information text or POI address is the only the. The application example can more accurately, efficiently and flexibly determine whether an address is unique in the same city, thereby greatly improving the coverage of address recognition.
【技术实现步骤摘要】
一种确定地址唯一性的方法、装置及系统
本申请涉及信息处理
,特别是涉及一种确定地址唯一性的方法、装置及系统。
技术介绍
随着电子商务的迅猛发展,网上购物已经越来越普及,消费者早已习惯于网上采购商品。网上购物要依赖于物流将商品派送到客户手中,物流公司网点在进行物流派送时,通过将派送地址与揽派规则进行匹配,从而确定派送区域。显然,上述现有确定派送区域的方式依赖于地址的准确性。然而,在实际派送时,经常遇到地址信息不完整或错误的情况,这样现有方式就无法确定对应的派送区域。现有技术还提供一种改进方案,即先对派送地址进行纠错处理,然后将纠错后的地址与揽派规则进行匹配,从而确定派送范围。然而,该现有技术取决于地址纠错算法的精确度,如果经过纠错后的地址是错误的,则将错误地址与揽派规则进行匹配,其结果必定也是错误的。因此,如何更准确、高效地确定某个地址在同一个城市内是否是唯一的,成为亟需本领域技术人员解决的技术问题。
技术实现思路
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种确定地址唯一性的方法、装置及系统。本申请公开了一种确定地址唯一性的方法,包括:基于多条包含相同道路或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的。相应的,本申请公开了一种确定地址唯一性的装置,包括:经纬度获取模块,用于基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;聚类处理模块,用于对所述多个经纬度坐标进行聚类处理; ...
【技术保护点】
一种确定地址唯一性的方法,其特征在于,包括:基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的。
【技术特征摘要】
1.一种确定地址唯一性的方法,其特征在于,包括:基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的。2.根据权利要求1所述的方法,其特征在于,所述根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的步骤,包括:若所述聚类处理的结果为能够聚成一个类,则确定所述多条包含相同道路信息或POI信息的文本地址是唯一的;若所述聚类处理的结果为不能够聚成一个类,则确定所述多条包含相同道路信息或POI信息的文本地址不是唯一的。3.根据权利要求1所述的方法,其特征在于,所述基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标的步骤之前,还包括:从文本地址库中获取多条文本地址。4.根据权利要求3所述的方法,其特征在于,所述从文本地址库中获取多条文本地址的步骤之后,还包括:判断所述每条文本地址中的道路信息或POI信息是否在同一个行政区中;如果判断结果为不在同一个行政区中,则基于所述多条包含相同道路信息或POI信息的文本地址获取相应的经纬度坐标;如果判断结果为在同一个行政区中,则确定包含所述道路信息或POI信息的地址是唯一的。5.根据权利要求4所述的方法,其特征在于,所述判断所述每条文本地址中的道路信息或POI信息是否在同一个行政区中的步骤,包括:针对每条文本地址进行分词和切词处理,获得所述每条文本地址的城市、行政区、道路信息或POI信息;统计所述道路信息或POI信息在同一个城市各个行政区中的分布比例;若所述分布比例不低于预设阈值,则进一步判断所述文本地址中的道路信息或POI信息是否只分布在同一个行政区中,若是,则判定包含所述道路信息或POI信息的文本地址是唯一的。6.根据权利要求1所述的方法,其特征在于,所述基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标的步骤,包括:针对每条文本地址进行分词和切词处理,获得所述每条文本地址的城市、行政区、道路信息或POI信息;选出属于同一个城市的具有相同道路信息或POI信息的文本地址;基于选出的多条包含相同道路或POI的文本地址,从地址经纬度信息库获取相应的经纬度坐标。7.根据权利要求1所述的方法,其特征在于,所述对所述多个经纬度坐标进行聚类处理的步骤包括:分别通过lng=lng*1000,lat=lat*1000的方式对所述多个经纬度坐标进行计算得到相应的经纬度网格坐标;采用预设的最小点数和半径数目对所述经纬度网格坐标信息进行聚类处理。8.一种确定派送地址可达的方法,其特征在于,包括:基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的;若所述多条包含相同道路信息或POI信息的文本地址是唯一的,则将所述多条文本地址记录为可送达的地址。9.一种确定地址唯一性的装置,其特征在于,包括:经纬度获取模块,用于基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个...
【专利技术属性】
技术研发人员:邓勇,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。