基于字典树的地址预测方法、装置、设备和存储介质制造方法及图纸

技术编号:35902658 阅读:18 留言:0更新日期:2022-12-10 10:39
本发明专利技术公开了一种基于字典树的地址预测方法、装置、设备和存储介质,针对现有的基于神经网络的地址预测算法准确率低的问题,通过服务端获取历史揽派件成功的物流数据,提取物流数据中物流订单的包括揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址在内的地址数据;采用双数组字典树算法,以物流订单为单位,对地址数据进行归集,得到地址数据集;获取目标物流订单数据,将目标物流订单的寄件地址及收件地址输入基于地址数据集的地址预测模块,得到目标物流订单的揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址。用字典树代替神经网络的分类器,对叶节点进行精细化管理,提高地址预测准确率。高地址预测准确率。高地址预测准确率。

【技术实现步骤摘要】
基于字典树的地址预测方法、装置、设备和存储介质


[0001]本专利技术属于物流管理的
,尤其涉及一种基于字典树的地址预测方法、装置、设备和存储介质。

技术介绍

[0002]地址归集是快递业的核心业务,从订单开始能准确预测到地址对应的揽派件分拨、网点、业务员,是提高快递业务效率、降低投诉率非常重要的。
[0003]目前的地址预测大多采用神经网络,如基于FASTTEXT算法的神经网络模型,存在迭代速度慢,对配置要求高,且准确率不够高,模型精细度不够等问题。

技术实现思路

[0004]本专利技术的目的是提供一种基于字典树的地址预测方法、装置、设备和存储介质,对地址集进行精细化管理,提高地址预测的准确率。
[0005]为解决上述问题,本专利技术的技术方案为:
[0006]一种基于字典树的地址预测方法,包括:
[0007]服务端获取历史揽派件成功的物流数据,提取物流数据中每个物流订单的包括揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址在内的地址数据;
[0008]采用双数组字典树算法,以物流订单为单位,对所述地址数据进行归集,得到地址数据集;
[0009]获取目标物流订单数据,将目标物流订单的寄件地址及收件地址输入基于地址数据集的地址预测模块,得到所述目标物流订单的揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址。
[0010]根据本专利技术一实施例,所述采用双数组字典树算法,以物流订单为单位,对所述地址数据进行归集进一步包括:
[0011]获取每个物流订单的寄件地址对应的网点标识和收件地址的对应的网点标识,从而确定揽件网点的地址及目的网点的地址;
[0012]对揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址进行编码;
[0013]对所述编码进行基于双数组字典树的地址归集,得到地址数据集。
[0014]根据本专利技术一实施例,所述对编码进行基于双数组字典树的地址归集进一步包括:
[0015]一个编码即为一个节点;
[0016]在构造双数组时,根据当前活动节点层中节点的直接子节点数,计算概率评价函数:
[0017][0018]得到:
[0019]其中,i
*
为当前活动节点层的第i个活动节点下的直接子节点数,N为当前活动节点层下的所有活动节点的直接子节点数的总和,n为当前活动节点层共有n个活动节点;
[0020]赋予当前活动节点层中所有节点的插入概率区间:
[0021][0022]在[0,1]区间内随机生成一个插入因子,确定所述插入因子所属的插入概率区间,将所述插入概率区间的活动节点选入。
[0023]根据本专利技术一实施例,所述获取每个物流订单的寄件地址对应的网点标识和收件地址的对应的网点标识,从而确定揽件网点的地址及目的网点的地址进一步包括:
[0024]在揽件区域找到满足预设条件的若干POI核心点,POI核心点包含名称、类别、坐标、分类在内的信息;
[0025]给每一POI核心点添加围栏,表示出每个揽件区域,具体为:
[0026]创建每一POI核心点为一个中心点坐标;
[0027]按照预设半径值添加圆形围栏,形成一适配的揽件区域,建立所述揽件区域与网点标识的适配关系;
[0028]确定寄件地址所处的揽件区域,得到所述揽件区域对应的网点标识。
[0029]根据本专利技术一实施例,所述获取目标物流订单数据,将目标物流订单的寄件地址及收件地址输入基于地址数据集的地址预测模块,得到所述目标物流订单的揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址进一步包括:
[0030]将目标物流订单的寄件地址及收件地址输入所述地址预测模块,得到包含寄件地址对应的网点标识及收件地址对应的网点标识的第一中间结果;
[0031]所述地址预测模块根据所述第一中间结果,查询网点信息表,得到包含揽件网点地址的编码及目的网点地址的编码的第二中间结果;
[0032]根据所述第二中间结果,查询所述地址数据集,得到所述目标物流订单的揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址信息。
[0033]根据本专利技术一实施例,得到所述目标物流订单的揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址之后,还包括:
[0034]对得到的揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址进行验证,若出现异常,则按预设算法进行地址纠错。
[0035]一种基于字典树的地址预测装置,包括:
[0036]数据预处理模块,用于服务端获取历史揽派件成功的物流数据,提取物流数据中每个物流订单的包括揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址在内的地址数据;
[0037]地址归集模块,用于采用双数组字典树算法,以物流订单为单位,对所述地址数据
进行归集,得到地址数据集;
[0038]地址预测模块,用于获取目标物流订单数据,将目标物流订单的寄件地址及收件地址输入基于地址数据集的地址预测模块,得到所述目标物流订单的揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址。
[0039]根据本专利技术一实施例,所述地址归集模块包括:
[0040]初始地址获取模块,用于获取每个物流订单的寄件地址对应的网点标识和收件地址的对应的网点标识,从而确定揽件网点的地址及目的网点的地址;
[0041]编码模块,用于对揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址进行编码;
[0042]归集模块,用于对所述编码进行基于双数组字典树的地址归集,得到地址数据集。
[0043]一种基于字典树的地址预测设备,包括:存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行本专利技术一实施例中的基于字典树的地址预测方法中的步骤。
[0044]一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行本专利技术一实施例中的基于字典树的地址预测方法中的步骤。
[0045]本专利技术由于采用以上技术方案,使其与现有技术相比具有以下的优点和积极效果:
[0046]本专利技术一实施例中的基于字典树的地址预测方法,针对现有的基于神经网络的地址预测算法准确率低的问题,通过服务端获取历史揽派件成功的物流数据,提取物流数据中每个物流订单的包括揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址在内的地址数据;采用双数组字典树算法,以物流订单为单位,对所述地址数据进行归集,得到地址数据集;获取目标物流订单数据,将目标物流订单的寄件地址及收件地址输入基于地址数据集的地址预测模块,得到所述目标物流订单的揽件网点的地址、始发分拨中心的地址本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于字典树的地址预测方法,其特征在于,包括:服务端获取历史揽派件成功的物流数据,提取物流数据中每个物流订单的包括揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址在内的地址数据;采用双数组字典树算法,以物流订单为单位,对所述地址数据进行归集,得到地址数据集;获取目标物流订单数据,将目标物流订单的寄件地址及收件地址输入基于地址数据集的地址预测模块,得到所述目标物流订单的揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址。2.如权利要求1所述的基于字典树的地址预测方法,其特征在于,所述采用双数组字典树算法,以物流订单为单位,对所述地址数据进行归集进一步包括:获取每个物流订单的寄件地址对应的网点标识和收件地址的对应的网点标识,从而确定揽件网点的地址及目的网点的地址;对揽件网点的地址、始发分拨中心的地址、目的分拨中心的地址和目的网点的地址进行编码;对所述编码进行基于双数组字典树的地址归集,得到地址数据集。3.如权利要求2所述的基于字典树的地址预测方法,其特征在于,所述对编码进行基于双数组字典树的地址归集进一步包括:一个编码即为一个节点;在构造双数组时,根据当前活动节点层中节点的直接子节点数,计算概率评价函数:得到:其中,i
*
为当前活动节点层的第i个活动节点下的直接子节点数,N为当前活动节点层下的所有活动节点的直接子节点数的总和,n为当前活动节点层共有n个活动节点;赋予当前活动节点层中所有节点的插入概率区间:在[0,1]区间内随机生成一个插入因子,确定所述插入因子所属的插入概率区间,将所述插入概率区间的活动节点选入。4.如权利要求2所述的基于字典树的地址预测方法,其特征在于,所述获取每个物流订单的寄件地址对应的网点标识和收件地址的对应的网点标识,从而确定揽件网点的地址及目的网点的地址进一步包括:在揽件区域找到满足预设条件的若干POI核心点,POI核心点包含名称、类别、坐标、分类在内的信息;给每一POI核心点添加围栏,表示出每个揽件区域,具体为:创建每一POI核心点为一个中心点坐标;
按照预设半径值添加圆形围栏,形成一适配的揽件区域,建立所述揽件区域与网点标识的适配关系;确定寄件地址所处的揽件区域,得到所述揽件区域对应的网点标识。5.如权利要求1所述的基于字典树的地址预测方法,其特征在于,所述获取目标物流订单数据,将目标物流订单的寄件地址及收件地址输入基于地址数据集的地址预测模块,得到所述目标物流...

【专利技术属性】
技术研发人员:蒋晓天杨周龙
申请(专利权)人:上海东普信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1