一种基于反向生成的地址树的地址匹配方法及匹配系统技术方案

技术编号:7246064 阅读:249 留言:0更新日期:2012-04-11 18:40
本发明专利技术适用于数据处理领域,提供了一种基于反向生成的地址树的地址匹配方法,包括下述步骤:步骤A,将待匹配的行地址拆为若干地址元;步骤B,根据步骤A拆得的地址元在地址树中查找对应的节点,地址树为一树状结构的数据库,根据已投递的地址信息或未投递但经过分拣的邮件地址信息定期生成;步骤C,根据步骤B中查找到的节点从地址树中筛出与待匹配的行地址对应的地址树分枝;步骤D,根据步骤C筛出的地址树分枝将待匹配的行地址匹配到对应的站段规则。本发明专利技术利用生产过程中的已投递信息、未投递但经过分拣的邮件地址信息反向生成地址树,使地址树能够做到与生产近期数据同步,自动更新其对应邮编、投递站、投递段等结果。

【技术实现步骤摘要】

本专利技术属于数据处理领域,尤其涉及一种基于反向生成的地址树的地址匹配方法及匹配系统
技术介绍
目前,基于地址匹配的技术在物流行业被广泛采用,根据收货人的全地址信息匹配到邮编,或配送机构,或具体位置信息,然后再根据匹配的信息封发出口,大大提高了其配货效率,另外,根据匹配的信息还可将货物信息传递给接货机构,使货物的运输和接收质量得到保障。现有的地址匹配技术通常有以下两种行地址樽糊匹配一根据客户的地址内容,在行地址库进行查询或模糊查询,或者将客户的地址内容进行分割,在地址库进行模糊查询,找到相似的记录。这种算法存在三个问题1.行地址库写法各异,同一个地址可能有几十种写法,以致需要收集大量的行地址树据,匹配效率将大大下降。2.对于行地址对应的邮编,配货站维护不便,一旦有地址基础信息发生变化,其地址库的维护不能保证相同的地址也能维护到。3.行地址的多条信息与模糊匹配算法造成匹配结果有多条,对于大批量的匹配,自动运算并自动选择其中一条, 造成匹配正确率下降。基础地址元匹配—又称地址树匹配,通过地址维护系统进行基础地址维护,不断累积,形成地址元字典,地址元之间的关系通过树型描述,客户待匹配的地址通过地址元字典和地址树进行查找进行匹配。这种算法存在两个问题1.地址元字典需要大量的人工去维护。2.如果地址元的门牌内容其配送机构发生变化,其基础数据的更改工作非常巨大, 更改不及时,造成匹配正确率下降。
技术实现思路
本专利技术所要解决的技术问题在于提供一种基于反向生成的地址树的地址匹配方法,旨在降低地址匹配的人工成本并提高匹配正确率。本专利技术是这样实现的,一种基于反向生成的地址树的地址匹配方法,包括下述步骤步骤A,将待匹配的行地址拆为若干地址元;步骤B,根据步骤A拆得的地址元在地址树中查找对应的节点;所述地址树为一树状结构的数据库,根据已投递的地址信息或未投递但经过分拣的邮件地址信息定期生成, 所述地址树包含有呈层级分布的多个地址节点,其中上一级节点的地址范围包含下一级节点的地址范围,区以下的各节点对应有站段规则信息;步骤C,根据步骤B中查找到的节点从所述地址树中筛出与待匹配的行地址对应的地址树分枝;步骤D,根据步骤C筛出的地址树分枝将待匹配的行地址匹配到对应的站段规则。进一步地,在所述步骤A之前,所述方法还包括下述步骤步骤A0,根据已投递地址信息或未投递但经过分拣的邮件地址信息定期生成地址树。进一步地,所述步骤AO具体为根据已投递地址信息或未投递但经过分拣的邮件地址信息,并结合原有的地址树,定期生成新的地址树。本专利技术还提供了一种基于反向生成的地址匹配系统,包括反向地址树生成单元,用于根据已投递地址信息或未投递但经过分拣的邮件地址信息定期生成地址树;所述地址树为一树状结构的数据库,包含有呈层级分布的多个地址节点,其中上一级节点的地址范围包含下一级节点的地址范围,区以下的各节点对应有站段规则信息;行地址拆词单元,用于将待匹配的行地址拆为若干地址元;节点查找单元,用于根据所述行地址拆词单元拆得的地址元在所述反向地址树生成单元生成的地址树中查找对应的节点;地址树分枝确定单元,用于根据所述节点查找单元查找到的节点从所述地址树中筛出与待匹配的行地址对应的地址树分枝;匹配单元,用于根据所述地址树分枝确定单元筛出的地址树分枝将待匹配的行地址匹配到对应的站段规则。进一步地,所述反向地址树生成单元具体根据已投递地址信息或未投递但经过分拣的邮件地址信息,并结合原有的地址树,定期生成新的地址树。进一步地,所述站段规则信息包括邮编信息、投递站信息、投递段信息、序信息。本专利技术还提供了一种邮政信息分拣系统,其包括如上所述的基于反向生成的地址树的地址匹配系统。本专利技术还提供了一种综合型地址匹配系统,包括包括如上所述的基于反向生成的地址树的地址匹配系统在内的若干地址匹配子系统;权重系数设置子系统,用于设置所述若干地址匹配子系统分别针对各个行地址信息的权重系数;匹配结果计算子系统,用于根据所述若干地址匹配子系统针对待匹配的行地址的匹配结果,以及所述权重系数设置子系统中预设所述若干地址匹配子系统分别针对各个行地址信息的权重系数,计算得到最终匹配结果。本专利技术利用生产过程中的已投递信息、未投递但经过分拣的邮件地址信息,根据关键字提取算法,反向形成基础地址节点并定期更新地址树,使地址树能够做到与生产近期数据同步,自动更新其对应邮编、投递、站段等结果,不用人工参与,大大降低了人工成本。此匹配算法可与其他的匹配算法集成应用,弥补其他匹配算法的不足,提高整体地址匹配能力。附图说明图1是本专利技术实施例提供的基于反向生成的地址树的地址匹配方法的实现流程图;图2是本专利技术实施例提供的地址树的拓扑原理图;图3是本专利技术实施例提供的基于反向生成的地址树的地址匹配系统的结构原理图;图4是本专利技术实施例提供的综合型地址匹配系统的架构图。 具体实施例方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例中,利用生产过程中的已投递信息、未投递但经过分拣的邮件地址信息,反向生成地址树并可定期更新,使地址树能够做到与生产近期数据同步。图1示出了本专利技术实施例提供的基于反向生成的地址树的地址匹配方法的实现流程,详述如下。在步骤A中,将待匹配的行地址拆为若干地址元。本专利技术实施例中,行地址即为待投递的地址,投递前需将行地址匹配到相应的投递站、投递段等,以已安排相关的投递员进行投递,如“广东省深圳市罗湖区深南东路3040 号邮政大厦”即为一行地址,可将此行地址拆为“广东省”、“深圳市”、“罗湖区”、“深南东路”、 “3040 号”等。步骤B,根据步骤A拆得的地址元在反向生成的地址树中查找对应的节点。上述地址树为一树状结构的数据库,如图2所示,其根据已投递的地址信息或未投递但经过分拣的邮件地址信息生成,可保证地址树能够做到与生产近期数据同步,提高匹配正确率。上述地址树包含有呈层级分布的多个地址节点,其中上一级节点的地址范围包含下一级节点的地址范围,如图2示出的地址树中,根节点为“中国”,与根节点“中国”直接相邻的第一层级节点为“北京”、“广东”等,“北京”的第二层级节点包括“西城区”,“广东” 的第二层级节点包括“广州”、“深圳”等,“深圳”再下面的层级中包含有区、路、门牌号等层级,图2中粗线框内表示的节点路径即为“广东省深圳市罗湖区深南东路3040号邮政大厦” 所对应的地址树分枝,而区以下的各节点对应有站段规则信息。 本专利技术中,此站段规则信息具体又包含与行政区划匹配信息和标志地址信息对应的邮编信息、投递站信息、投递段信息和序信息,站段规则用于表征投递地址区域,其中投递站信息为邮政投递机构信息,代表着投递站负责的投递区域,投递段信息比投递站范围小,通常为单个投递员负责的投递区域,序信息为在投递过程中的顺序号。例如行政区划为罗湖区,标志地址为邮政大厦的标志地址对应的邮编为518001,投递站为建设路投递站,投递段为1段,序为2。因此进一步地,在步骤A之前,还包括下述步骤步骤A0,根据已投递地址信息或未投递但经过分拣的邮件地址信息定期生成地址树。本专利技术中,具体可通过如下方式反向生本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:崔超
申请(专利权)人:深圳市络道科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术