一种确定地址唯一性的方法、装置及系统制造方法及图纸

技术编号:17109906 阅读:25 留言:0更新日期:2018-01-24 22:30
本申请实施例提供一种确定地址唯一性的方法、装置及系统。所述方法包括:基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的。本申请实施例可以更准确、高效、灵活地确定某个地址在同一个城市内是否是唯一的,进而大幅度提升地址识别的覆盖率。

A method, device, and system for determining the uniqueness of an address

The application embodiment provides a method, a device, and a system for determining the uniqueness of the address. The method comprises: a plurality of containing the same road information or interest points POI information text address access to multiple latitude coordinate based on; the plurality of latitude and longitude clustering; according to the clustering results to determine the plurality of road information contains the same information text or POI address is the only the. The application example can more accurately, efficiently and flexibly determine whether an address is unique in the same city, thereby greatly improving the coverage of address recognition.

【技术实现步骤摘要】
一种确定地址唯一性的方法、装置及系统
本申请涉及信息处理
,特别是涉及一种确定地址唯一性的方法、装置及系统。
技术介绍
随着电子商务的迅猛发展,网上购物已经越来越普及,消费者早已习惯于网上采购商品。网上购物要依赖于物流将商品派送到客户手中,物流公司网点在进行物流派送时,通过将派送地址与揽派规则进行匹配,从而确定派送区域。显然,上述现有确定派送区域的方式依赖于地址的准确性。然而,在实际派送时,经常遇到地址信息不完整或错误的情况,这样现有方式就无法确定对应的派送区域。现有技术还提供一种改进方案,即先对派送地址进行纠错处理,然后将纠错后的地址与揽派规则进行匹配,从而确定派送范围。然而,该现有技术取决于地址纠错算法的精确度,如果经过纠错后的地址是错误的,则将错误地址与揽派规则进行匹配,其结果必定也是错误的。因此,如何更准确、高效地确定某个地址在同一个城市内是否是唯一的,成为亟需本领域技术人员解决的技术问题。
技术实现思路
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种确定地址唯一性的方法、装置及系统。本申请公开了一种确定地址唯一性的方法,包括:基于多条包含相同道路或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的。相应的,本申请公开了一种确定地址唯一性的装置,包括:经纬度获取模块,用于基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;聚类处理模块,用于对所述多个经纬度坐标进行聚类处理;唯一性确定模块,用于根据所述聚类处理的结果确定多条包含相同道路信息或POI信息的文本地址是否是唯一的。本申请还公开了一种包括如上所述的确定地址唯一性的装置的一种确定地址唯一性的系统。此外,本申请还公开了一种确定派送地址可达的方法,包括:基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的;若所述多条包含相同道路信息或POI信息的文本地址是唯一的,则将所述多条文本地址记录为可送达的地址。相应的,本申请公开了一种确定派送地址可达的装置,包括:经纬度获取模块,用于基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;聚类处理模块,用于对所述多个经纬度坐标进行聚类处理;唯一性确定模块,用于根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的;记录模块,用于若所述唯一性确定模块确定所述多条包含相同道路信息或POI信息的文本地址是唯一的,则将所述多条文本地址记录为可送达的地址。根据本申请提供的具体实施例,本申请公开了以下技术效果:本申请实施例通过对基于多条包含相同道路信息或POI信息的文本地址获取到的多个相应的经纬度坐标进行聚类处理,再根据所述聚类处理的结果判断所述多条包含相同道路信息或POI信息的文本地址是不是唯一的。因此,本申请实施例可以在派送地址中地址信息不规范、甚至信息错误的情况,仍然可以确定该地址在城市中是否是唯一的。因此,本申请实施例可以更准确、高效、灵活地确定某个地址在同一个城市内是否是唯一的,进而大幅度提升地址识别的覆盖率。进一步的,本申请实施例可以先通过判断每条文本地址中的道路信息或POI信息是否在同一个行政区中;在判断结果为在同一个行政区中的情况下,可以直接确定包含所述道路信息或POI信息的地址是唯一的。而仅在判断结果为不在同一个行政区中的情况下,才基于多条包含相同道路信息或POI信息的文本地址获取相应的经纬度坐标,进而通过聚类处理的结果判断包含所述道路信息或POI信息的地址是不是唯一的。本申请实施例通过将文本地址分析与经纬度聚类处理相结合来确定地址的唯一性,可以兼顾产品和工程上的需要,在大规模分布式并行计算环境下实现,可以最大化的减少计算资源的消耗,从而大幅度的缩短计算时间。综上,通过本申请实施例,可以更准确、高效、灵活地确定某个地址在同一个城市内是否是唯一的,从而大幅度提升地址识别的覆盖率;同时也能减少资源消耗,大量的节省时间和人力成本。当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请的一种确定地址唯一性的方法实施例的步骤流程图;图2是本申请的另一种确定地址唯一性的方法实施例的步骤流程图;图3是本申请的一种文本地址分析方法实施例的步骤流程图;图4是本申请的一种经纬度聚类处理方法实施例的步骤流程图;图5是本申请的一种确定地址唯一性的装置实施例的结构框图;图6是本申请的另一种确定地址唯一性的装置实施例的结构框图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请作进一步详细的说明。本申请实施例可以应用在基于派送地址与揽派规则相匹配的现有物流揽派智能系统中,再通过对基于多条包含相同道路信息或POI信息的文本地址获取到的多个相应的经纬度坐标进行聚类处理,进而根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是不是唯一的。因此,本申请实施例可以在派送地址中地址信息不规范、甚至信息错误的情况,仍然可以确定该地址在城市中是否是唯一的。与现有技术相比,本申请实施例可以更准确、高效、灵活地确定某个地址在同一个城市内是否是唯一的,进而大幅度提升地址识别的覆盖率。进一步的,本申请实施例可以先通过判断每条文本地址中的道路信息或POI信息是否在同一个行政区中;在判断结果为在同一个行政区中的情况下,可以直接确定包含所述道路信息或POI信息的地址是唯一的。而仅在判断结果为不在同一个行政区中的情况下,才基于多条包含相同道路信息或POI信息的文本地址获取相应的经纬度坐标,进而通过聚类处理的结果判断包含所述道路信息或POI信息的地址是不是唯一的。本申请实施例通过将文本地址分析与经纬度聚类处理相结合来确定地址的唯一性,可以兼顾产品和工程上的需要,在大规模分布式并行计算环境下实现,可以最大化的减少计算资源的消耗,从而大幅度的缩短计算时间。综上,通过本申请实施例,可以更准确、高效、灵活地确定某个地址在同一个城市内是否是唯一的,从而大幅度提升地址识别的覆盖率;同时也能减少资源消耗,大量的节省时间和人力成本。实施例一参照图1,示出了本申请的一种确定地址唯一性的方法实施例的步骤流程图,所述方法包括如下步骤:步骤102、基于多条包含相同道路信息或POI(PointofInterest,兴趣点)信息的文本地址获取多个经纬本文档来自技高网...
一种确定地址唯一性的方法、装置及系统

【技术保护点】
一种确定地址唯一性的方法,其特征在于,包括:基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的。

【技术特征摘要】
1.一种确定地址唯一性的方法,其特征在于,包括:基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的。2.根据权利要求1所述的方法,其特征在于,所述根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的步骤,包括:若所述聚类处理的结果为能够聚成一个类,则确定所述多条包含相同道路信息或POI信息的文本地址是唯一的;若所述聚类处理的结果为不能够聚成一个类,则确定所述多条包含相同道路信息或POI信息的文本地址不是唯一的。3.根据权利要求1所述的方法,其特征在于,所述基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标的步骤之前,还包括:从文本地址库中获取多条文本地址。4.根据权利要求3所述的方法,其特征在于,所述从文本地址库中获取多条文本地址的步骤之后,还包括:判断所述每条文本地址中的道路信息或POI信息是否在同一个行政区中;如果判断结果为不在同一个行政区中,则基于所述多条包含相同道路信息或POI信息的文本地址获取相应的经纬度坐标;如果判断结果为在同一个行政区中,则确定包含所述道路信息或POI信息的地址是唯一的。5.根据权利要求4所述的方法,其特征在于,所述判断所述每条文本地址中的道路信息或POI信息是否在同一个行政区中的步骤,包括:针对每条文本地址进行分词和切词处理,获得所述每条文本地址的城市、行政区、道路信息或POI信息;统计所述道路信息或POI信息在同一个城市各个行政区中的分布比例;若所述分布比例不低于预设阈值,则进一步判断所述文本地址中的道路信息或POI信息是否只分布在同一个行政区中,若是,则判定包含所述道路信息或POI信息的文本地址是唯一的。6.根据权利要求1所述的方法,其特征在于,所述基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标的步骤,包括:针对每条文本地址进行分词和切词处理,获得所述每条文本地址的城市、行政区、道路信息或POI信息;选出属于同一个城市的具有相同道路信息或POI信息的文本地址;基于选出的多条包含相同道路或POI的文本地址,从地址经纬度信息库获取相应的经纬度坐标。7.根据权利要求1所述的方法,其特征在于,所述对所述多个经纬度坐标进行聚类处理的步骤包括:分别通过lng=lng*1000,lat=lat*1000的方式对所述多个经纬度坐标进行计算得到相应的经纬度网格坐标;采用预设的最小点数和半径数目对所述经纬度网格坐标信息进行聚类处理。8.一种确定派送地址可达的方法,其特征在于,包括:基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个经纬度坐标;对所述多个经纬度坐标进行聚类处理;根据所述聚类处理的结果确定所述多条包含相同道路信息或POI信息的文本地址是否是唯一的;若所述多条包含相同道路信息或POI信息的文本地址是唯一的,则将所述多条文本地址记录为可送达的地址。9.一种确定地址唯一性的装置,其特征在于,包括:经纬度获取模块,用于基于多条包含相同道路信息或兴趣点POI信息的文本地址获取多个...

【专利技术属性】
技术研发人员:邓勇
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1