【技术实现步骤摘要】
基于LightGBM模型的快递物流时效预测方法
[0001]本专利技术涉及本专利技术属于物流领域陆运物流时效预测方法。
技术介绍
[0002]随着大数据的发展,数据信息对于决策具有举足轻重的作用。物流时效数据是涉及运输的公司进行决策需要考虑的因素之一,尤其在供应链管理中,物流影响着供应水平以及响应能力,拥有完整的物流时效数据对于提高供应链管理水平具有重要意义。
[0003]目前,国内外预测物流时效的方法包括机器学习方法、回归分析法以及自回归时间序列模型等。
[0004]现有技术Li X,Bai R,Siebers P O,et al.Travel time prediction in transport and logistics:Towards more efficient vehicle GPS data management using tree ensemble methods[J].VINE Journal of Information and Knowledge Management Systems,2019.该技术采用随机森林和梯度提升回归树两种方法,以GPS数据为特征变量,研究了在没有其他信息情况下车辆驾驶时间的预测方法。
[0005]CN 113011666A专利文献《时效预测模型的训练方法、时效预测方法及相关设备》运用物流站点和途径时间数据,构建了基于循环神经网络和深度因子分解机的物流时效预测模型。
[0006]Khiari J,Olaverri
‑ >Monreal C.Boosting algorithms for delivery time prediction in transportation logistics[C]//2020International Conference on Data Mining Workshops(ICDMW).IEEE,2020:251
‑
258.。该技术研究了线性回归模型、基于树的集成方法包括随机森林、bagging算法和boosting算法来预测运输时间。样本数据包括行程编号、行程描述、停止编号、客户名称、地址、预定交货时间和实际交货时间。
[0007]然而,现有的很多预测物流时效的方法对数据信息要求较多,设定的特征变量所需数据获取难度较大,尤其对于本就没有完整物流时效数据的情况,要获取这些额外的数据信息需要花费更多的时间成本、人力成本等,因此这些方法的可行性较低。
[0008]现有技术中,业界大多采用机器学习方法预测物流时效,Boosting算法因为准确率高而计算时间短,成为运用较多的一种方法。但是这些方法设定的特征变量所需数据通常为公司内部非公开数据,非快递物流运营商获取这些数据难度较大,这限制了这些方法的应用范围。此外,中国县级市级别以上城市有3333个,每两个城市之间的物流时效数据呈千万级数据量,通过收集数据的方式获取完整数据对于非快递物流运营商不可行。
技术实现思路
[0009]本专利技术的目的专利技术快递物流时效预测方法,是为了搭建完整的快递物流时效数据体系,为有该数据需求的企业提供一种可行的预测方法。例如,供应链管理涉及仓库调拨、采购等产品转移的环节,需要考虑快递物流的运输时间,即物流时效。物流时效是影响供应链供给水平、响应能力的因素,拥有完备的快递物流时效数据,可以帮助供应链管理公司指
定计划,提高管理水平。非快递物流经营公司,难以获取到完整的物流时效数据,因此专利技术快递物流时效预测方法。
[0010]本专利技术的技术方案是:
[0011]基于LightGBM模型的快递物流时效预测方法,包括如下步骤:
[0012]S1获取物流时效样本数据;所述物流时效样本数据为两个城市之间快递物流时效数据;
[0013]S2模型特征变量所需数据为公开数据,收集特征变量数据,并对特征变量进行整理;
[0014]S3构建LightGBM模型预测市到市的物流时效;
[0015]S4根据市到市的物流时效,推导市到县、县到县的物流时效,设定阈值,根据行车里程,对市到县、县到县的物流时效进行调整。
[0016]在一个实施例中,所述获取物流时效样本数据,包括:
[0017]物流数据有三个维度:发出地,目的地以及两地之间的物流时效。
[0018]物流时效样本数据获取方式:由合作的快递物流运营商提供、由历史寄运的快递数据整理得到、通过在互联网上查询来收集样本数据等。
[0019]在一个实施例中,所述特征变量所需数据为公开数据,收集特征变量数据,并对特征变量进行整理,包括:
[0020]特征变量包括发出城市类型、目的城市类型、发出省份、目的省份、发出城市名称、目的城市名称、发出城市经度、发出城市纬度、目的城市经度、目的城市纬度、发出城市GDP、目的城市GDP、发出城市人均GDP、目的城市人均GDP、行车里程以及集货时间;
[0021]城市类型包括首都、直辖市、省会、地级市以及县级市。为了描述方便,将首都、直辖市、省会、地级市称之为市,县级市称之为县;
[0022]发出省份为快件发出地隶属省份;目的省份为快件接收地隶属省份;发出城市名称为发出地隶属的首都、直辖市、省会或者地级市;目的城市名称为目的地隶属的首都、直辖市、省会或者地级市;
[0023]发出城市经度、发出城市纬度、目的城市经度、目的城市纬度通过地图开放平台获取;
[0024]发出城市GDP、目的城市GDP通过统计年鉴查询;
[0025]行车里程,通过地图开放平台下载发出地到目的地的行车里程。
[0026]在一个实施例中,所述发出城市人均GDP、目的城市人均GDP,包括:
[0027]以第七次人口普查数据为标准,通过政府网站查询城市的人口数量;
[0028]用城市GDP除以城市人口数量得到城市人均GDP。
[0029]在一个实施例中,所述集货时间,包括:
[0030]快递公司从收到快件到开始运输的时间称为集货时间,集货时间是影响物流时效的重要因素,因此作为模型的一个特征变量;
[0031]通过地图开放平台下载发出地到目的地的行车时间;根据《道路交通安全法实施条例》对连续驾驶停车休息时间的要求,对行车时间进行修改,每行车4个小时,休息30分钟,每行车10个小时,休息8个小时;
[0032]集货时间由物流时效减去修改的行车时间得到,集货时间为发出省份到目的省份
的集货时间。
[0033]在一个实施例中,所述集货时间为发出省份到目的省份的集货时间,包括:
[0034]对于发出省份相同并且目的省份也相同的情况,求其集货时间的平均值,作为发出省份到目的省份的集货时间;
[0035]当某两个省份之间的集货时间缺失时,通过收集更多的物流时效数据来解决。
[0036]在一个实施例中,所述发出城市类型、发出省份、发出城市名称、目的城市类型、目的省份、目的城市名称,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于LightGBM模型的快递物流时效预测方法,其特征在于,包括如下步骤:S1获取物流时效样本数据;所述物流时效样本数据为两个城市之间快递物流时效数据;S2模型特征变量所需数据为公开数据;收集特征变量数据,并对特征变量进行整理;S3构建LightGBM模型预测市到市的物流时效;S4根据市到市的物流时效,推导市到县、县到县的物流时效;设定阈值,根据行车里程,对市到县、县到县的物流时效进行调整。2.根据权利要求1所述的方法,其特征在于,所述获取物流时效样本数据,包括:物流数据有三个维度:发出地,目的地以及两地之间的物流时效。物流时效样本数据获取方式:由合作的快递物流运营商提供、由历史寄运的快递数据整理得到、通过在互联网上查询来收集样本数据。3.根据权利要求1所述的方法,其特征在于,所述特征变量所需数据为公开数据;收集特征变量数据,并对特征变量进行整理,包括:特征变量包括发出城市类型、目的城市类型、发出省份、目的省份、发出城市名称、目的城市名称、发出城市经度、发出城市纬度、目的城市经度、目的城市纬度、发出城市GDP、目的城市GDP、发出城市人均GDP、目的城市人均GDP、行车里程以及集货时间;城市类型包括首都、直辖市、省会、地级市以及县级市;发出省份为快件发出地隶属省份;目的省份为快件接收地隶属省份;发出城市名称为发出地隶属的首都、直辖市、省会或者地级市;目的城市名称为目的地隶属的首都、直辖市、省会或者地级市;发出城市经度、发出城市纬度、目的城市经度、目的城市纬度通过地图开放平台获取;发出城市GDP、目的城市GDP通过统计年鉴查询;行车里程,通过地图开放平台下载发出地到目的地的行车里程。4.根据权利要求3所述的方法,其特征在于,所述集货时间,包括:快递公司从收到快件到开始运输的时间称为集货时间;集货时间由物流时效减去修改的行车时间得到,集货时间为发出省份到目的省份的集货时间。5.根据权利要求3所述的方法,其特征在于,所述集货时间为发出省份到目的省份的集货时间,包括:对于发出省份相同并且目的省份也相同的情况,求其集货时间的平均值,作为发出省份到目的省份的集货时间;当某两个省份之间的集货时间缺失时,通过收集更多的物流时效数据来解决。6.根据权利要求3所述的方法,其特征在于,所述发出城市类型、发出省份、发出城市名称、目的城市类型、目的省份、目的城市名称,包括:特征变量中发出城市类型、发出省份、发出城市名称、目的城市类...
【专利技术属性】
技术研发人员:陈莉娜,
申请(专利权)人:迈创企业管理服务股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。