一种地址识别方法及装置制造方法及图纸

技术编号:15840503 阅读:55 留言:0更新日期:2017-07-18 16:48
本申请提供了一种地址识别方法及装置,从原始地址中提取行政级别最低的地址名称,并从预设的数据库中查找与政级别最低的地址名称相同的目标地址,判断原始地址中的原始上级地址集合与目标地址的目标上级地址集合是否满足匹配条件,如果是,将目标地址及所述目标上级地址集合中的地址组成的地址链作为原始地址的识别结果,匹配条件包括:原始上级地址集合为目标上级地址集合的子集,并且原始上级地址集合中的地址名称之间的相对顺序与所述目标上级地址集合中相同的地址名称之间的相对顺序相同,所以,能够依据预设的地址数据库将不规范的地址识别为符合地址分拣规则的地址,从而为后续的自动分拣奠定基础。

Address identification method and device

The invention provides a method and device address recognition, extract the lowest administrative level address name from the original address, and find the default database from government and the lowest level of the same name and address of the target address, the original address in the original judgment superior address set and the target address of the target address set is superior to satisfy the matching conditions and if it is, the destination address and the address in the address set higher goals which address chain as the original address recognition results, matching conditions include: the original superior address set is a subset of target address set higher, and the relative order between the same relative order between the original superior address set in the name and address the target set in superior address address name the same, so, according to the preset address database specification will not Addresses are identified as addresses that match the address sorting rules, thus laying the foundation for subsequent automatic sorting.

【技术实现步骤摘要】
一种地址识别方法及装置
本申请涉及计算机领域,尤其涉及一种地址识别方法及装置。
技术介绍
分拣是指根据邮件或快件上所书写的地址,按照预设分拣的路由(即路向)逐渐分入相关格口或码堆的过程。为了提高分拣效率,自动分拣已经逐渐代替了人工分拣。提供给自动分拣系统地收货地址通常为如下数据结构{"province":"浙江省","city":"杭州市","area":"余杭区","town":"仓前街道","address_detail":"测试地址"},其中,"province"、"city"、"area"及"town"为行政区划。"province"代表第一级行政区划:省、直辖市、自治区或特别行政区,"city"代表第二级行政区划:地级市、自治州、直辖市辖区或直辖市辖县等,"area"代表第三级行政区划:县、县级市、地级市辖区等,"town"代表第四级行政区划:乡、镇、街道等,"address_detail"表示详细地址。常用的自动分拣方式以末节地址为分拣单位,末级地址是指国家、省、市、区(县)、街道(乡镇)等行政区划中,非空的最小行政区划。可见,自动分拣高度依赖收货地址,所以,一旦收货地址本文档来自技高网...
一种地址识别方法及装置

【技术保护点】
一种地址识别方法,其特征在于,包括:从原始地址中提取行政级别最低的地址名称,所述原始地址包括所述地址名称以及原始上级地址集合,所述原始上级地址集合是所述原始地址中除所述地址名称以外其它地址名称的集合;从预设的地址数据库中查找与提取到的所述行政级别最低的地址名称相同的目标地址;判断所述原始地址中的所述原始上级地址集合与所述目标地址的目标上级地址集合是否满足匹配条件,如果是,则将所述目标地址及所述目标上级地址集合中的地址组成的地址链作为所述原始地址的识别结果;其中,所述目标上级地址集合为所述目标地址在所述地址数据库中的上级地址按照行政级别进行前后顺序的排序而形成的集合,所述匹配条件包括:所述原始上...

【技术特征摘要】
1.一种地址识别方法,其特征在于,包括:从原始地址中提取行政级别最低的地址名称,所述原始地址包括所述地址名称以及原始上级地址集合,所述原始上级地址集合是所述原始地址中除所述地址名称以外其它地址名称的集合;从预设的地址数据库中查找与提取到的所述行政级别最低的地址名称相同的目标地址;判断所述原始地址中的所述原始上级地址集合与所述目标地址的目标上级地址集合是否满足匹配条件,如果是,则将所述目标地址及所述目标上级地址集合中的地址组成的地址链作为所述原始地址的识别结果;其中,所述目标上级地址集合为所述目标地址在所述地址数据库中的上级地址按照行政级别进行前后顺序的排序而形成的集合,所述匹配条件包括:所述原始上级地址集合为所述目标上级地址集合的子集,并且所述原始上级地址集合中的地址名称之间的相对顺序与所述目标上级地址集合中相同的地址名称之间的相对顺序相同。2.根据权利要求1所述的方法,其特征在于,在所述判断所述原始地址中的所述原始上级地址集合与所述目标地址的目标上级地址集合是否满足匹配条件之前,还包括:确定所述目标地址的行政级别符合分拣规则的要求。3.根据权利要求2所述的方法,其特征在于,所述从原始地址中提取级别最低的地址名称包括:从所述原始地址中的各个非空的行政区划中提取地址名称;从所提取的各个地址名称中选择行政级别最低的地址名称。4.根据权利要求3所述的方法,其特征在于,所述预设的数据库中包括地址数据结构,每一个地址数据结构包括:编号、上级地址编号及地址名称;所述从预设的地址数据库中查找与提取到的所述行政级别最低的地址名称相同的目标地址,包括:从所述预设的地址数据库中查找与提取到的所述行政级别最低的地址名称相同的地址名称,作为目标地址;确定所述目标地址的目标上级地址集合,包括:依据所述目标地址所对应的上级地址编号,从所述预设的地址数据库中找到所述目标地址的上级地址,并且以此类推,直到找到所述目标地址的所有上级地址,由此构成所述目标上级地址集合。5.根据权利要求1至4任一项所述的方法,其特征在于,还包括:如果所述原始上级地址集合与所述目标上级地址集合不满足所述匹配条件,将所述原始地址中各个行政区划和详细地址中的地址名称拼接为字符串;对所述字符串进行分词处理,得到各个分词;从预设的地址词典中查找所述各个分词匹配的地址行政区划,将所述各个分词匹配的地址行政区划作为所述原始地址的识别结果。6.根据权利要求5所述的方法,其特征在于,在所述从预设的地址词典中查找所述各个分词匹配的地址行政区划之后,还包括:使用所述原始地址的识别结果进行地址分拣。7.一种地址识别装置,其特征在于,包括...

【专利技术属性】
技术研发人员:田国超
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1