一种用于生成推荐配送地点名称的方法和装置制造方法及图纸

技术编号:10314309 阅读:148 留言:0更新日期:2014-08-13 16:26
本发明专利技术公开了一种用于生成推荐配送地点名称的方法,主要是针对一已知地址进行文本分词、分词拼接、数据库查重、计算匹配频度和频度阈值重置等步骤。本发明专利技术还公开了一种用于生成推荐配送地点名称的装置。利用本发明专利技术可自动、及时、快速、准确地生成可推荐的配送地点名称。

【技术实现步骤摘要】
一种用于生成推荐配送地点名称的方法和装置
本专利技术涉及物流
,具体涉及一种用于生成推荐配送地点名称的方法和装置。
技术介绍
随着网络购物的蓬勃发展,物流中的包裹配送速度已成为提升网络购物体验的瓶颈环节。通常,物流公司利用分拣配送系统制定包裹配送路线规划,该系统基于生产配送地点名称数据库,将包裹的收货地址按就近原则对应到公司的配送站点,然后将包裹分拣并配送到配送站点,由配送站点的配送人员将包裹配送到具体的收货地址,如XX大厦、XX小区、XX街道等。在此过程中,分拣配送系统中预存的生产配送地点名称丰富与否,制约着分拣配送系统的自动化程度。为了维护分拣配送系统中的生产配送地点名称数据库,需定期或不定期将新增的配送地点名称添加到数据库中,供分拣配送系统完成包裹配送路线规划。当前,对生产配送地点名称数据库的维护更新大多依靠人工手动完成,参见图1,当希望向数据库中添加某一配送地点名称时,首先,操作人员将该配送地点名称(一般包括省、市、区(县)、乡(社区)四级行政区域名称和具体地址名称)手动输入到分拣配送系统中,分拣配送系统在原数据库中查询是否已存在该配送地点名称,如果存在,不添加该名称,提示输入其它名称或结束流程;如果不存在,将该名称添加到数据库中,或者是先添加到推荐列表中,经人工审核后再存入数据库,进入生产系统。上述处理方式存在以下弊端:首先,人工手动添加方式要求必须有人员不断地执行添加配送地点名称的动作,人力资源投入大,成本高。其次,随着城市化进程加速,城市建筑规模不断扩大,城市内大楼、小区、商场等地点名称更新频繁,配送地点名称的数量增长迅速,人工手动添加必然存在信息更新的延迟,这种低效的方式不但造成资源(人力、物力、财力)浪费,还将使新配送地点名称的推荐被延迟,配送地点名称不能及时丰富,制约分拣配送系统的分拣配送处理能力,影响物流配送系统的整体效率。
技术实现思路
有鉴于此,本专利技术提供一种用于生成推荐配送地点名称的方法和装置,通过对已知地址进行分词、拼接和匹配频度控制等处理,生成可推荐的配送地点名称。一方面,本专利技术提供一种用于生成推荐配送地点名称的方法,包括:第一步,将已知配送地址切分为多个分词,其中所述多个分词按预定顺序排列;第二步,将多个分词中的第一分词和第二分词拼接,形成第一临时配送地点名称,其中第二分词和第一分词相邻;第三步,查询生产配送地点名称数据库,如果数据库中存在第一临时配送地点名称,舍弃所述已知配送地址;如果数据库中不存在第一临时配送地点名称,执行第四步;第四步,将第一临时配送地点名称与历史配送地址库进行匹配,获得第一临时配送地点名称在历史配送地址库中的匹配频度,该匹配频度小于或等于预定频度阈值时,执行第五步,反之执行第六步;第五步,将第一临时配送地点名称确定为推荐配送地点名称;第六步,降低预定频度阈值,得到新的频度阈值,并将第一临时配送地点名称与第三分词拼接,形成第二临时配送地点名称,返回第三步,其中以新的频度阈值代替预定频度阈值,并以第二临时配送地点名称代替第一临时配送地点名称;如此循环,直至当前匹配频度小于或等于当前频度阈值;其中第三分词和第二分词相邻。优选地,在第一步将已知配送地址切分为多个分词之前,所述方法还包括:查询所述已知配送地址中是否含有特定配送地址,如果含有特定配送地址,舍弃所述已知配送地址;其中特定配送地址指在历史配送地址库中对应的记录数超过预定值的地址。优选地,在第一步将已知配送地址切分为多个分词之前,所述方法还包括:将已知配送地址中的行政区域地址全部舍弃;在第二步将多个分词中的第一分词和第二分词拼接之后,所述方法还包括:将已舍弃的行政区域地址拼接在第一分词和第二分词之前,形成第一临时配送地点名称。优选地,在第一步将已知配送地址切分为多个分词之后,所述方法还包括:查询多个分词中是否含有一级词根,如果含有一级词根,将排列在该一级词根之后的分词全部舍弃,基于剩余的分词执行第二步;其中一级词根的地址仅对应一个配送站点。优选地,如果所述多个分词中不含有一级词根,所述方法还包括:查询多个分词中是否含有二级词根,如果含有二级词根,将排列在该二级词根之后的分词全部舍弃,基于剩余的分词执行第二步;如果不含有二级词根,舍弃所述已知配送地址;其中二级词根的地址对应至少两个配送站点。优选地,在确定推荐配送地点名称之后,所述方法还包括:按照预定规则修改所述推荐配送地点名称。优选地,修改所述推荐配送地点名称包括:如果所述推荐配送地点名称中含有切割词,将排列在该切割词之前的分词全部舍弃,其中切割词含有阿拉伯数字,位于推荐配送地点名称的中部。优选地,修改所述推荐配送地点名称包括:如果所述推荐配送地点名称中含有黑名单词,舍弃该黑名单词,其中黑名单词含有阿拉伯数字,位于推荐配送地点名称的首部。优选地,在确定推荐配送地点名称之后,所述方法还包括:验证推荐配送地点名称的长度是否符合长度限制条件,如果不符合,舍弃推荐配送地点名称。另一方面,本专利技术还提供一种用于生成推荐配送地点名称的方法,包括:第一步,查询一已知配送地址中是否含有特定配送地址,如果含有特定配送地址,舍弃所述已知配送地址;如果不含有特定配送地址,执行第二步;其中特定配送地址指在历史配送地址库中对应的记录数超过预定值的地址;第二步,将所述已知配送地址中的行政区域地址全部舍弃;第三步,将所述已知配送地址中的剩余文本切分为多个分词,其中所述多个分词按预定顺序排列;第四步,查询所述多个分词中是否含有一级词根,如果含有一级词根,将排列在该一级词根之后的分词全部舍弃,基于剩余的分词执行第五步;如果所述多个分词中不含有一级词根,查询所述多个分词中是否含有二级词根,如果含有二级词根,将排列在该二级词根之后的分词全部舍弃,基于剩余的分词执行第五步;如果不含有二级词根,舍弃所述剩余文本;其中一级词根的地址仅对应一个配送站点,二级词根的地址对应至少两个配送站点;第五步,将所述剩余的分词中的第一分词和第二分词拼接,并将已舍弃的行政区域地址拼接在第一分词和第二分词之前,形成第一临时配送地点名称;其中第二分词和第一分词相邻;第六步,查询生产配送地点名称数据库,如果数据库中存在第一临时配送地点名称,舍弃所述已知配送地址;如果数据库中不存在第一临时配送地点名称,执行第七步;第七步,将第一临时配送地点名称与历史配送地址库进行匹配,获得第一临时配送地点名称在历史配送地址库中的匹配频度,该匹配频度小于或等于预定频度阈值时,执行第八步,反之执行第九步;第八步,将第一临时配送地点名称确定为推荐配送地点名称;第九步,降低预定频度阈值,得到新的频度阈值,并将第一临时配送地点名称与第三分词拼接,形成第二临时配送地点名称,返回第六步,其中以新的频度阈值代替预定频度阈值,并以第二临时配送地点名称代替第一临时配送地点名称;如此循环,直至当前匹配频度小于或等于当前频度阈值,执行第十步;其中第三分词和第二分词相邻;第十步,查询推荐配送地点名称中是否含有切割词,如果含有切割词,将排列在该切割词之前的分词全部舍弃,执行第十一步;否则直接执行第十一步;其中切割词含有阿拉伯数字,位于推荐配送地点名称的中部;第十一步,查询推荐配送地点名称中是否含有黑名单词,如果含有黑名单词,舍弃该黑名单词,执行第十本文档来自技高网
...
一种用于生成推荐配送地点名称的方法和装置

【技术保护点】
一种用于生成推荐配送地点名称的方法,其特征在于,包括:第一步,将已知配送地址切分为多个分词,其中所述多个分词按预定顺序排列;第二步,将多个分词中的第一分词和第二分词拼接,形成第一临时配送地点名称,其中第二分词和第一分词相邻;第三步,查询生产配送地点名称数据库,如果数据库中存在第一临时配送地点名称,舍弃所述已知配送地址;如果数据库中不存在第一临时配送地点名称,执行第四步;第四步,将第一临时配送地点名称与历史配送地址库进行匹配,获得第一临时配送地点名称在历史配送地址库中的匹配频度,该匹配频度小于或等于预定频度阈值时,执行第五步,反之执行第六步;第五步,将第一临时配送地点名称确定为推荐配送地点名称;第六步,降低预定频度阈值,得到新的频度阈值,并将第一临时配送地点名称与第三分词拼接,形成第二临时配送地点名称,返回第三步,其中以新的频度阈值代替预定频度阈值,并以第二临时配送地点名称代替第一临时配送地点名称;如此循环,直至当前匹配频度小于或等于当前频度阈值;其中第三分词和第二分词相邻。

【技术特征摘要】
1.一种用于生成推荐配送地点名称的方法,其特征在于,包括:第一步,将已知配送地址切分为多个分词,其中所述多个分词按预定顺序排列;第二步,将多个分词中的第一分词和第二分词拼接,形成第一临时配送地点名称,其中第二分词和第一分词相邻;第三步,查询生产配送地点名称数据库,如果数据库中存在第一临时配送地点名称,舍弃所述已知配送地址;如果数据库中不存在第一临时配送地点名称,执行第四步;第四步,将第一临时配送地点名称与历史配送地址库进行匹配,获得第一临时配送地点名称在历史配送地址库中的匹配频度,该匹配频度小于或等于预定频度阈值时,执行第五步,反之执行第六步;第五步,将第一临时配送地点名称确定为推荐配送地点名称;第六步,降低预定频度阈值,得到新的频度阈值,并将第一临时配送地点名称与第三分词拼接,形成第二临时配送地点名称,返回第三步,其中以新的频度阈值代替预定频度阈值,并以第二临时配送地点名称代替第一临时配送地点名称;如此循环,直至当前匹配频度小于或等于当前频度阈值;其中第三分词和第二分词相邻。2.如权利要求1所述的用于生成推荐配送地点名称的方法,其特征在于,在第一步将已知配送地址切分为多个分词之前,所述方法还包括:查询所述已知配送地址中是否含有特定配送地址,如果含有特定配送地址,舍弃所述已知配送地址;其中特定配送地址指在历史配送地址库中对应的记录数超过预定值的地址。3.如权利要求1所述的用于生成推荐配送地点名称的方法,其特征在于,在第一步将已知配送地址切分为多个分词之前,所述方法还包括:将已知配送地址中的行政区域地址全部舍弃;在第二步将多个分词中的第一分词和第二分词拼接之后,所述方法还包括:将已舍弃的行政区域地址拼接在第一分词和第二分词之前,形成第一临时配送地点名称。4.如权利要求1所述的用于生成推荐配送地点名称的方法,其特征在于,在第一步将已知配送地址切分为多个分词之后,所述方法还包括:查询多个分词中是否含有一级词根,如果含有一级词根,将排列在该一级词根之后的分词全部舍弃,基于剩余的分词执行第二步;其中一级词根的地址仅对应一个配送站点,所述一级词根为对应一个配送站点的分词。5.如权利要求4所述的用于生成推荐配送地点名称的方法,其特征在于,如果所述多个分词中不含有一级词根,所述方法还包括:查询多个分词中是否含有二级词根,如果含有二级词根,将排列在该二级词根之后的分词全部舍弃,基于剩余的分词执行第二步;如果不含有二级词根,舍弃所述已知配送地址;其中二级词根的地址对应至少两个配送站点,所述二级词根为对应至少两个配送站点的分词,所述二级词根的地址粒度大于所述一级词根的地址粒度。6.如权利要求1所述的用于生成推荐配送地点名称的方法,其特征在于,在确定推荐配送地点名称之后,所述方法还包括:按照预定规则修改所述推荐配送地点名称。7.如权利要求6所述的用于生成推荐配送地点名称的方法,其特征在于,修改所述推荐配送地点名称包括:如果所述推荐配送地点名称中含有切割词,将排列在该切割词之前的分词全部舍弃,其中切割词含有阿拉伯数字,位于推荐配送地点名称的中部。8.如权利要求6所述的用于生成推荐配送地点名称的方法,其特征在于,修改所述推荐配送地点名称包括:如果所述推荐配送地点名称中含有黑名单词,舍弃该黑名单词,其中黑名单词含有阿拉伯数字,位于推荐配送地点名称的首部。9.如权利要求1所述的用于生成推荐配送地点名称的方法,其特征在于,在确定推荐配送地点名称之后,所述方法还包括:验证推荐配送地点名称的长度是否符合长度限制条件,如果不符合,舍弃推荐配送地点名称。10.一种用于生成推荐配送地点名称的方法,其特征在于,包括:第一步,查询一已知配送地址中是否含有特定配送地址,如果含有特定配送地址,舍弃所述已知配送地址;如果不含有特定配送地址,执行第二步;其中特定配送地址指在历史配送地址库中对应的记录数超过预定值的地址;第二步,将所述已知配送地址中的行政区域地址全部舍弃;第三步,将所述已知配送地址中的剩余文本切分为多个分词,其中所述多个分词按预定顺序排列;第四步,查询所述多个分词中是否含有一级词根,如果含有一级词根,将排列在该一级词根之后的分词全部舍弃,基于剩余的分词执行第五步;如果所述多个分词中不含有一级词根,查询所述多个分词中是否含有二级词根,如果含有二级词根,将排列在该二级词根之后的分词全部舍弃,基于剩余的分词执行第五步;如果不含有二级词根,舍弃所述剩余文本;其中一级词根的地址仅对应一个配送站点,二级词根的地址对应至少两个配送站点,所述一级词根为对应一个配送站点的分词,所述二级词根为对应至少两个配送站点的分词,所述二级词根的地址粒度大于所述一级词根的地址粒度;第五步,将所述剩余的分词中的第一分词和第二分词拼接,并将已舍弃的行政区域地址拼接在第一分词和第二分词之前,形成第一临时配送地点名称;其中第二分词和第一分词相邻;第六步,查询生产配送地点名称数据库,如果数据库中存在第一临时配送地点名称,舍弃所述已知配送地址;如果数据库中不存在第一临时配送地点名称,执行第七步;第七步,将第一临时配送地点名称与历史配送地址库进行匹配,获得第一临时配送地点名称在历史配送地址库中的匹配频度,该匹配频度小于或等于预定频度阈值时,执行第八步,反之执行第九步;第八步,将第一临时配送地点名称确定为推荐配送地点名称;第九步,降低预定频度阈值,得到新的频度阈值,并将第一临时配送地点名称与第三分词拼接,形成第二临时配送地点名称,返回第六步,其中以新的频度阈值代替预定频度阈值,并以第二临时配送地点名称代替第一临时配送地点名称;如此循环,直至当前匹配频度小于或等于当前频度阈值,执行第十步;其中第三分词和第二分词相邻;第十步,查询推荐配送地点名称中是否含有切割词,如果含有切割词,将排列在该切割词之前的分词全部舍弃,执行第十一步;否则直接执行第十一步;其中切割词含有阿拉伯数字,位于推荐配送地点名称的中部;第十一步,查询推荐配送地点名称中是否含有黑名单词,如果含有黑名单词,舍弃该黑名单词,执行第十二步;否则直接执行第十二步;其中黑名单词含有阿拉伯数字,位于推荐配送地点名称的首部;第十二步,查询推荐配送地点名称中的分词是否全部属于预设的词根集合,如果全部属于预设的词根集合,舍弃所述已知配送地址,如果不全部属于预设的词根集合,执行第十三步;其中所述预设的词根集合包含所述一级词根和所述二级词根;第十三步,验证推荐配送地点名称的长度是否符合长度限制条件,如果不符合,舍弃该推荐配送地点名称。11.一种用于生成推荐配送地点名称的装置,其特征在于,包括:分词处理模块,用于将已知配送地址切分为多个分词,其中所述多个分词按预定顺序排列;第一拼接处理模块,用于将多个分词中的第一分词和第二分词拼接,形成第一临时配送地点名称,其中第二分词和第一分词相邻;查重处理模块,用于查询生产配送地点名称数据库,如果该数据库中存在第一临时配送地点名称,舍弃所述已知配送地址...

【专利技术属性】
技术研发人员:韩松
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1