【技术实现步骤摘要】
件量预测方法及装置、设备和存储介质
本申请涉及快递配送管理
,具体涉及一种件量预测方法及装置、设备和存储介质。
技术介绍
对于快递行业,长期件量预测非常重要,可以支持资源调配,人员排班,高峰指挥调度等事宜。然而由于快递行业的件量变化存在着多周期性(例如周、月、季度等)、长期趋势明显、存在滞后期、不同网点间差异大、受到天气和重大节假日等外生冲击影响、具有节前节后效应等数据特征,导致预测场景非常复杂。图1为某网点的真实派件量示意图。如图1所示,该网点中,清明节、端午节、五一、十一等节假日对件量形成了向下的外生冲击,双十一、双十二等购物节对件量形成了向上的外生冲击,而春节、中秋等节日对件量形成了先向上后向下的外生冲击,等等。上述复杂场景对现有的件量预测技术产生了很大挑战,导致现有的件量预测技术的预测结果存在较大偏差。当前业界应用的件量预测方法均存在显著缺陷,其中自回归积分滑动平均模型(ARIMA)在长期预测方向会发生漂移,不能进行有效的长期预测;随机森林模型、XGboost模型、Prophet模型均未考虑时间序列的先后顺序,即时间较远的样本与较新的样本有相同的权重,无法充分利用信息,长期预测效果不佳。
技术实现思路
鉴于现有技术中的上述缺陷或不足,期望提供一种对于快递行业复杂场景的长期件量预测效果较好的件量预测方法及装置、设备和存储介质。第一方面,本专利技术提供一种件量预测方法,包括:获取历史数据,生成标注有若干快递行业特征的数据集,并从该数据集中划分出训练集和验证集;快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征;建 ...
【技术保护点】
1.一种件量预测方法,其特征在于,包括:获取历史数据,生成标注有若干快递行业特征的数据集,并从所述数据集中划分出训练集和验证集;所述快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征;建立所述训练集的第一件量序列与所述快递行业特征的线性回归模型,提取第一线性序列信息;根据所述第一件量序列和所述第一线性序列信息获得第一残差序列信息,并根据所述第一残差序列信息生成周期池;将所述验证集的第二件量序列输入所述线性回归模型以提取第二线性序列信息;根据所述第二件量序列和所述第二线性序列信息获得第二残差序列信息,并根据所述周期池提取所述第二残差序列信息的若干周期序列以检验所述第二残差序列信息是否具有周期性:是,则通过状态空间模型从所述第二残差序列信息中提取周期效应与滞后期信息,根据所述第二线性序列信息和所述周期效应与滞后期信息生成第二预测结果并输出。
【技术特征摘要】
1.一种件量预测方法,其特征在于,包括:获取历史数据,生成标注有若干快递行业特征的数据集,并从所述数据集中划分出训练集和验证集;所述快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征;建立所述训练集的第一件量序列与所述快递行业特征的线性回归模型,提取第一线性序列信息;根据所述第一件量序列和所述第一线性序列信息获得第一残差序列信息,并根据所述第一残差序列信息生成周期池;将所述验证集的第二件量序列输入所述线性回归模型以提取第二线性序列信息;根据所述第二件量序列和所述第二线性序列信息获得第二残差序列信息,并根据所述周期池提取所述第二残差序列信息的若干周期序列以检验所述第二残差序列信息是否具有周期性:是,则通过状态空间模型从所述第二残差序列信息中提取周期效应与滞后期信息,根据所述第二线性序列信息和所述周期效应与滞后期信息生成第二预测结果并输出。2.根据权利要求1所述的方法,其特征在于,所述获取历史数据,生成标注有若干快递行业特征的数据集,并从所述数据集中划分出训练集和验证集包括:获取历史数据,将所述历史数据存储为原始数据集;将所述原始数据集导入节假日模板,生成标注有若干快递行业特征的数据集;将所述数据集划分为训练集、验证集和测试集。3.根据权利要求2所述的方法,其特征在于,所述获取历史数据,将所述历史数据存储为原始数据集之前还包括:生成标注有若干快递行业特征的节假日模板;所述长期趋势特征包括以下至少一项:日趋势指数、周趋势指数、月趋势指数、季度趋势指数、年趋势指数、周期趋势指数;所述节假日特征包括以下至少一项:节假日名称、是否节假日、是否节前、是否节后、是否调休日;所述购物节特征包括以下至少一项:购物节名称、是否购物节、是否购物节前、是否购物节后;所述其它外生冲击特征包括以下至少一项:天气、是否网点工作日、是否某大客户工作日。4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:在所述第二残差序列信息不具有周期性时,优化所述线性回归模型,生成第一预测结果并输出。5.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述第一件量序列和所述第一线性序列信息获得第一残差序列信息,并根据所述第一残差序列信息生成周期池包括:根据所述第一件量序列和所述第一线性序列信息获得第一残差序列信息;根据所述第一残差序列信息生成功率谱图以筛选出若干预定范围内的功率谱图周期;根据各所述功率谱图周期和若干快递行业常用周期生成周期池。6.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述周期池提取所述第二残差序列信息的若干周期序列以检验所述第二残差序列信息是否具有周期性包括:根据所述周期池生成若干周期序列,对各周期序列进行排列组合,并筛选出各周期序列组合中平均绝对百分误差值(MAPE)最小的若干周期序列组合;判断筛选出的各周期序列组合的MAPE是否相同:是,则所述第二残差序列信息不具有周期性;否,则所述第二残差序列信息具有周期性。7.根据权利要求1-3任一项所述的方法,其特征在于,所述通过状态空间模型从所述第二残差序列信息中提取周期效应与滞后期信息,根据所述第二线性序列信息和所述周期效应与滞后期信息生成第二预测结果并输出包括:通过状态空间模型从所述第二残差序列信息中提取周期效应与滞后期信息;根据所述第二残差序列信息和所述周期效应与滞后期信息生成第三残差序列信息;对所述第三残差序列信息进行白噪声检验:检验通过,则根据所述第二线性序列信息和所述周期效应与滞后期信息生成第二预测结果并输出;检验失败,则返回优化所述线性回归模型,或,从所述第三残差序列信息中提取误差信息并结合所述第二线性序列信息和所述周期效应与滞后期信息生成第三预测结果并输出。8.根据权利要求2或3所述的方法,其特征在于,还包括:根据所述测试集的第三件量序列与所输出预测结果的平均绝对百分误差值(MAPE)评估预测效果。9.一种件量预测装置,其特征在于,包括:数据集配置单元,配置用于获取历史数据,生成标注有若干快递行业特征的数据集,并从所述数据集中划分出训练集和验证集;所述快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征;第一线性提取单元,配置用于建立所述训练集的第一件量序列与所述快递...
【专利技术属性】
技术研发人员:王本玉,许颖聪,金晶,
申请(专利权)人:顺丰科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。