一种在物流运输中车辆晚靠台预测的方法、装置和服务器制造方法及图纸

技术编号:32361017 阅读:14 留言:0更新日期:2022-02-20 03:28
本发明专利技术公开了一种在物流运输中车辆晚靠台预测的方法、装置和服务器。该方法,包括:获取目标车辆本次的订单信息和运单信息;基于所述订单信息和运单信息,关联预先建立的数据仓库中相应的参与实体信息及运输历史行为表现统计数据,汇集得到指标数据;将所述指标数据输入已训练的LightGBM模型;所述LightGBM模型与所述预先建立的数据仓库存在关联,用于在模型训练时获得实体属性补充信息和运输历史行为表现统计数据;所述LightGBM模型输出晚靠台预测结果。本发明专利技术基于LightGBM模型,通过与数据仓库关联的训练,将运单、订单之外的信息也纳入到机器学习,最终能够低成本地实现对目标车辆晚靠台情况的准确预测。车辆晚靠台情况的准确预测。车辆晚靠台情况的准确预测。

【技术实现步骤摘要】
一种在物流运输中车辆晚靠台预测的方法、装置和服务器


[0001]本申请涉及物流信息处理
,具体涉及一种在物流运输中车辆晚靠台预测的方法。

技术介绍

[0002]在物流运输中,货运准时到达的重要性是显而易见的,如敏感的绿蔬、生鲜行业,运输时间的延长,直接意味着重大经济损失。
[0003]因此在派单与定价的环节是否可以对准时到达进行预测决策,就显得十分重要。进而预测工作的展开也有助于减少货运企业与货主减少经济损失,同时也为货运平台增加客户信用度。
[0004]目前,统计型探索式数据分析EDA对于运营车辆的管理起着至关重要的监督与决策作用,其中更加凭借经验对车辆晚靠台规律进行总结,从而影响预测决策,但该方法的作用是有限的,对个体运单的预测能力不足。而且物流运输因其低毛利的行业特点,对于中后台等人工成本管理十分敏感。
[0005]如果借鉴传统的的回归类预测模型,需要大量而繁琐的数据与特征处理环节,如降维变量筛选方面,对数据科学工作者的经验要求较高。这也在人力和时间方面为该项工作增加了成本。
[0006]通常中小型货物物流企业输入低毛利行业,风险高,运力流动性大,运力难管理,依靠中介,人工审核统计运营数据等现象,而运单晚靠台要承担违约的风险;同时,企业人力成本预算也是有限的。
[0007]因此,尤其中小型物流企业需要一种迭代成本较低、免于雇佣资深的职业分析人员的物流信息管理(晚靠台预测)的方案。

技术实现思路

[0008]基于此,针对上述技术问题,提供一种在物流运输中车辆晚靠台预测的方法、装置和服务器。
[0009]第一方面,一种在物流运输中车辆晚靠台预测的方法,包括:
[0010]获取目标车辆本次的订单信息和运单信息;
[0011]基于所述订单信息和运单信息,关联预先建立的数据仓库中相应的参与实体信息及运输历史行为表现统计数据,汇集得到指标数据;
[0012]将所述指标数据输入已训练的LightGBM模型;所述LightGBM模型与所述预先建立的数据仓库存在关联,用于在模型训练时获得实体属性补充信息和运输历史行为表现统计数据;
[0013]所述LightGBM模型输出晚靠台预测结果。
[0014]进一步地,所述LightGBM模型的构建及训练方法包括:
[0015]步骤1)通过运营平台的数据采集获得历史发生订单及运单相关数据;
[0016]步骤2)从货运业务角度进行数据清洗与分析探索,得到有效的订单信息和运单信息;
[0017]步骤3)根据所述有效的订单信息和运单信息,结合数据仓库中的实体(司机、车辆及承运商)维度数据和运输历史行为表现统计数据,汇集历史指标数据;
[0018]步骤4)对所述历史指标数据进行工程预处理,构建训练集;
[0019]步骤5)构建LightGBM模型,模型输入为训练集的指标数据,模型输出为晚靠台结果,训练模型带有监督数据指标,并自动迭代处理。
[0020]可选地,所述订单信息包括发车时间、运单创建时间、计划运达时间、收发货地、运输计划时长、货物种类、货物名称、货重和承运商名称;所述运单信息包括承运商名称、司机身份、车辆身份和装卸地磅重量。
[0021]可选地,步骤2)中所述数据清洗与分析探索,包括:
[0022]a.业务逻辑清洗:过滤已作废、未发布以及未完成的订单及运单;
[0023]b.基础信息不完整筛选:过滤基础信息不完整的订单及运单;所述基础信息包括司机、车辆和承运商信息;
[0024]c.数据质量清洗,包括过滤运单号不符合运单平台编码规则的运单、运单创建时间晚于运达时间的运单。
[0025]可选地,步骤3)中,结合数据仓库中的实体维度数据和运输历史行为表现统计数据,汇集历史指标数据,具体包括:
[0026]A.关联数据仓库获得实体属性补充信息,得到以下具体的基础信息:
[0027]司机信息:性别、年龄、常驻地、运输从业年限、驾龄和从业资格证类型;
[0028]车辆信息:车型、吨位、车高、车籍地和车辆运输证类型;
[0029]承运商信息:承运商和平台注册年限;
[0030]B.关联相关历史行为,得到以下运输历史行为表现统计数据:
[0031]司机:运费、运输重量、运单次数、高频次收货地、高频次发货地、高频次运输货物、运输货物类别和网货监管上传司机信息成功次数;
[0032]车辆:晚靠台次数、晚靠台百分比、车辆里程、装卸货重损失率和网货监管上传车辆信息成功次数;
[0033]承运商:货运重量、运费、网货上传运单与流水单成功次数和经营许可证类型。
[0034]可选地,步骤4)中对所述历史指标数据进行工程预处理,具体包括:
[0035]4.1)训练样本正负样本比例观测:
[0036]根据多次历史数据统计,收录晚靠台发生率较高且样本正负较均衡的样本;若出现发生晚靠台样本比例过低,则找寻违约成本较低类型订单进行下探策略补充样本,或者采用SMOTE方法构造样本;
[0037]4.2)数据离散化处理:
[0038]对于连续数据,分段离散化处理;
[0039]对于文本数据,转换为数值型数据;
[0040]运用sklearn.preprocessing算法包进行数据预处理,文本运用独热编码。
[0041]可选地,步骤5)中,模型输出的晚靠台结果为1或0,1代表晚靠台,0代表正常时间内靠台。
[0042]第二方面,一种在物流运输中车辆晚靠台预测的装置,包括以下程序模块:
[0043]目标信息获取模块,用于获取目标车辆本次的订单信息和运单信息;
[0044]指标数据提取模块,基于所述订单信息和运单信息,关联预先建立的数据仓库中相应的参与实体信息及运输历史行为表现统计数据,汇集得到指标数据;
[0045]数据处理模块,用于将所述指标数据输入已训练的LightGBM模型,LightGBM模型输出晚靠台预测结果;所述LightGBM模型与所述预先建立的数据仓库存在关联,用于在模型训练时获得实体属性补充信息和运输历史行为表现统计数据。
[0046]第三方面,一种用于车辆晚靠台预测的服务器,包括存储器和处理器,所述存储器存储有计算机程序,其特殊之处在于,所述处理器执行所述计算机程序时实现上述方法的步骤。
[0047]第四方面,一种计算机可读存储介质,其上存储有计算机程序,其特殊之处在于,所述计算机程序被处理器执行时实现上述方法的步骤。
[0048]本专利技术至少具有以下有益效果:
[0049]本专利技术基于LightGBM模型,通过与数据仓库关联的训练,将运单、订单之外的信息也纳入到机器学习,最终能够低成本地实现对目标车辆晚靠台情况的准确预测。
[0050]本专利技术为物流行业在科技信息化发展舔砖加瓦,是一种精细化数据管理在企业运营中的实践,对中小型物流运输平台的运营提质增效与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在物流运输中车辆晚靠台预测的方法,其特征在于,包括:获取目标车辆本次的订单信息和运单信息;基于所述订单信息和运单信息,关联预先建立的数据仓库中相应的参与实体信息及运输历史行为表现统计数据,汇集得到指标数据;将所述指标数据输入已训练的LightGBM模型;所述LightGBM模型与所述预先建立的数据仓库存在关联,用于在模型训练时获得实体属性补充信息和运输历史行为表现统计数据;所述LightGBM模型输出晚靠台预测结果。2.根据权利要求1所述的在物流运输中车辆晚靠台预测的方法,其特征在于,所述LightGBM模型的构建及训练方法包括:步骤1)通过运营平台的数据采集获得历史发生订单及运单相关数据;步骤2)从货运业务角度进行数据清洗与分析探索,得到有效的订单信息和运单信息;步骤3)根据所述有效的订单信息和运单信息,结合数据仓库中的实体维度数据和运输历史行为表现统计数据,汇集历史指标数据;步骤4)对所述历史指标数据进行工程预处理,构建训练集;步骤5)构建LightGBM模型,模型输入为训练集的指标数据,模型输出为晚靠台结果,训练模型带有监督数据指标,并自动迭代处理。3.根据权利要求2所述的在物流运输中车辆晚靠台预测的方法,其特征在于,所述订单信息包括发车时间、运单创建时间、计划运达时间、收发货地、运输计划时长、货物种类、货物名称、货重和承运商名称;所述运单信息包括承运商名称、司机身份、车辆身份和装卸地磅重量。4.根据权利要求2所述的在物流运输中车辆晚靠台预测的方法,其特征在于,步骤2)中所述数据清洗与分析探索,包括:a.业务逻辑清洗:过滤已作废、未发布以及未完成的订单及运单;b.基础信息不完整筛选:过滤基础信息不完整的订单及运单;所述基础信息包括司机、车辆和承运商信息;c.数据质量清洗,包括过滤运单号不符合运单平台编码规则的运单、运单创建时间晚于运达时间的运单。5.根据权利要求4所述的在物流运输中车辆晚靠台预测的方法,其特征在于,步骤3)中,结合数据仓库中的实体维度数据和运输历史行为表现统计数据,汇集历史指标数据,具体包括:A.关联数据仓库获得实体属性补充信息,得到以下具体的基础信息:司机信息:性别、年龄、常驻地、运输从业年限、驾龄和从业资格证类型;车辆信息:...

【专利技术属性】
技术研发人员:张拓沈党云樊彬孟宝
申请(专利权)人:中交智运有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1