一种地址匹配方法及匹配系统技术方案

技术编号:7053520 阅读:328 留言:0更新日期:2012-04-11 18:40
本发明专利技术适用于数据处理领域,提供了一种地址匹配方法,包括下述步骤:步骤A,从待匹配的行地址中解析出行政区划匹配信息和标志地址信息;步骤B,在标志地址库中查找与步骤A解析到的行政区划匹配信息和标志地址信息相匹配的站段规则;所述标志地址库中包含有与各行政区划匹配信息和标志地址信息对应的站段规则。本发明专利技术利用生产过程中的已投递的行地址、未投递但经过分拣的行地址,生成标志地址库并定期更新,使标志地址库能够做到与生产近期数据同步,自动更新其对应邮编、投递站、投递段、序等结果,不用人工参与,大大降低了人工成本。此匹配算法可与其他的匹配算法集成应用,弥补其他匹配算法的不足,提高整体地址匹配能力。

【技术实现步骤摘要】

本专利技术属于数据处理领域,尤其涉及一种地址匹配方法及匹配系统
技术介绍
目前,基于地址匹配的技术在物流行业被广泛采用,根据收货人的全地址信息匹配到邮编,或配送机构,或具体位置信息,然后再根据匹配的信息封发出口,大大提高了其配货效率,另外,根据匹配的信息还可将货物信息传递给接货机构,使货物的运输和接收质量得到保障。现有的地址匹配技术通常有以下两种行地址樽糊匹配一根据客户的地址内容,在行地址库进行查询或模糊查询,或者将客户的地址内容进行分割,在地址库进行模糊查询,找到相似的记录。这种算法存在三个问题1.行地址库写法各异,同一个地址可能有几十种写法,以致需要收集大量的行地址树据,匹配效率将大大下降。2.对于行地址对应的邮编,配货站维护不便,一旦有地址基础信息发生变化,其地址库的维护不能保证相同的地址也能维护到。3.行地址的多条信息与模糊匹配算法造成匹配结果有多条,对于大批量的匹配,自动运算并自动选择其中一条, 造成匹配正确率下降。基础地址元匹配—又称地址树匹配,通过地址维护系统进行基础地址维护,不断累积,形成地址元字典,地址元之间的关系通过树型描述,客户待匹配的地址通过地址元字典和地址树进行查找进行匹配。这种算法存在两个问题1.地址元字典需要大量的人工去维护。2.如果地址元的门牌内容其配送机构发生变化,其基础数据的更改工作非常巨大, 更改不及时,造成匹配正确率下降。
技术实现思路
本专利技术所要解决的技术问题在于提供一种地址匹配方法,旨在降低地址匹配的人工成本并提高匹配正确率。本专利技术是这样实现的,一种地址匹配方法,包括下述步骤步骤A,从待匹配的行地址中解析出行政区划匹配信息和标志地址信息;步骤B,在标志地址库中查找与步骤A解析到的行政区划匹配信息和标志地址信息相匹配的站段规则;所述标志地址库中包含有与各行政区划匹配信息和标志地址信息对应的站段规则。本专利技术还提供了一种地址匹配系统,包括行地址解析单元,用于从待匹配的行地址中解析出行政区划匹配信息和标志地址 fn息;行地址匹配单元,用于在标志地址库中查找与步骤A解析到的行政区划匹配信息和标志地址信息相匹配的站段规则;所述标志地址库中包含有与各行政区划匹配信息和标志地址信息对应的站段规则。进一步地,所述站段规则包括邮编信息、投递站信息、投递段信息、序信息。进一步地,所述标志地址库由已投递的或未投递但经过分拣的行地址信息定期生成。进一步地,所述标志地址信息为建筑物信息或建筑物+牌号格式的信息或道路+ 门牌格式的信息或单位/公司+部门格式的信息或花园小区+楼牌号格式的信息。本专利技术还提供了一种综合型地址匹配系统,包括包括如权利要求5至8任一项所述的地址匹配系统在内的若干地址匹配子系统;权重系数设置子系统,用于设置所述若干地址匹配子系统分别针对各个行地址信息的权重系数;匹配结果计算子系统,用于根据所述若干地址匹配子系统针对待匹配的行地址的匹配结果,以及所述权重系数设置子系统中预设所述若干地址匹配子系统分别针对各个行地址信息的权重系数,计算得到最终匹配结果。本专利技术利用生产过程中的已投递的行地址、未投递但经过分拣的行地址,生成标志地址库并定期更新,使标志地址库能够做到与生产近期数据同步,自动更新其对应邮编、 投递站、投递段、序等结果,不用人工参与,大大降低了人工成本。此匹配算法可与其他的匹配算法集成应用,弥补其他匹配算法的不足,提高整体地址匹配能力。附图说明图1是本专利技术实施例提供的地址匹配方法的实现流程图;图2是本专利技术实施例提供的地址匹配系统的结构原理图;图3是本专利技术实施例提供的邮政商函业务处理系的架构图。具体实施例方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术实施例中,利用生产过程中的已投递的行地址、未投递但经过分拣的行地址,生成标志地址库并定期更新,使标志地址库能够做到与生产近期数据同步。图1示出了本专利技术实施例提供的基于地址树的地址匹配方法的实现流程,详述如下。在步骤A中,从待匹配的行地址中解析出行政区划匹配信息和标志地址信息。本专利技术实施例中,行地址即为待投递的地址,投递前需将行地址匹配到相应的投递站、投递段等,以已安排相关的投递员进行投递,如“广东省深圳市罗湖区XX路XX号XX 大厦X座XX公司XX部门”即为一行地址,解析上述行地址具体可以采用拆词的方式实现, 如将上述行地址拆为“广东省深圳市罗湖区”、“XX路XX号”、“XX大厦”、“XX公司XX部门” 等,其中“广东省深圳市罗湖区”即为行政区划匹配信息,而标志地址信息可以为“XX大厦” 的建筑物信息(如湖北大厦),也可以为“XX大厦X座”的建筑物+牌号格式的信息(如赛格大厦A楼,王府井百货大楼),也可以为“XX路XX号”道路+门牌格式的信息(如三杨路 110,深南大道3040号,三元里56弄),也可以为“XX公司XX部门”的单位/公司+部门格式的信息(如华为公司培训中心,机修厂锻压分厂),还可以为花园小区+楼牌号格式的信息(如锦绣小区12栋,经济开发区56号)。本专利技术实施例中,具体根据关键字找到标志地址,关键字为“省”、“市”、“区”、“路”、 “街”、“道”、“号”、“楼”、“大厦”、“小区”等属性的字词,根据这些关键字眼进行拆词,如“广东省深圳市罗湖区XX路XX号XX大厦X座1101”,拆词为“广东省/深圳市/罗湖区/XX路 /XX号/XX大厦/X座1101”,然后根据上述关键字查找到标志地址1为“XX路XX号”,标志地址2为“XX大厦”。在步骤B中,在标志地址库中查找与步骤A解析到的行政区划匹配信息和标志地址信息相匹配的站段规则。本专利技术中,上述标志地址库由已投递的或未投递但经过分拣的行地址信息定期生成。其中包含有与各行政区划匹配信息和标志地址信息对应的站段规则,此站段规则具体又包含与行政区划匹配信息和标志地址信息对应的邮编信息、投递站信息、投递段信息和序信息,站段规则用于表征投递地址区域,其中投递站信息为邮政投递机构信息,代表着投递站负责的投递区域,投递段信息比投递站范围小,通常为单个投递员负责的投递区域,序信息为在投递过程中的顺序号。例如行政区划为罗湖区,标志地址为邮政大厦的标志地址对应的邮编为518001,投递站为建设路投递站,投递段为1段,序为2。本领域普通技术人员可以理解实现上述各实施例提供的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,所述的程序可以存储于一计算机可读取存储介质中,该存储介质可以为ROM/RAM、磁盘、光盘等。图2示出了本专利技术实施例提供的地址匹配系统的结构原理,为了便于描述,仅示出了与本专利技术相关的部分。此地址匹配系统可以为内置于邮件信息分拣系统、邮政商函业务处理系统中的软件单元或软硬件结合的单元。参照图2,本地址匹配系统包括行地址解析单元21和行地址及匹配单元22,其中, 行地址解析单元21首先从待匹配的行地址中解析出行政区划匹配信息和标志地址信息, 上述标志地址信息可以为建筑物信息或建筑物+牌号格式的信息或道路+门牌格式的信息或单位/公司+部门格式的信息或花园小区+楼牌号格式的信息,然后由行地址匹配单元 22在标志地址库中查找与步本文档来自技高网...

【技术保护点】
1.一种地址匹配方法,其特征在于,包括下述步骤:步骤A,从待匹配的行地址中解析出行政区划匹配信息和标志地址信息;步骤B,在标志地址库中查找与步骤A解析到的行政区划匹配信息和标志地址信息相匹配的站段规则;所述标志地址库中包含有与各行政区划匹配信息和标志地址信息对应的站段规则。

【技术特征摘要】

【专利技术属性】
技术研发人员:王福义
申请(专利权)人:深圳市络道科技有限公司
类型:发明
国别省市:94

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1