件量预测方法及装置、设备和存储介质制造方法及图纸

技术编号:21142252 阅读:21 留言:0更新日期:2019-05-18 05:29
本发明专利技术提供一种件量预测方法及装置、设备和存储介质,该方法包括:获取历史数据,生成标注有若干快递行业特征的数据集;将训练集输入线性回归模型,提取第一线性序列信息和第一残差序列信息,根据第一残差序列信息生成周期池;将验证集输入线性回归模型以提取第二线性序列信息和第二残差序列信息,并根据周期池提取第二残差序列信息的若干周期序列以检验第二残差序列信息是否具有周期性:是,则通过状态空间模型提取周期效应与滞后期信息,根据第二线性序列信息和周期效应与滞后期信息生成第二预测结果并输出。本发明专利技术实现了效果较好的长期件量预测。

【技术实现步骤摘要】
件量预测方法及装置、设备和存储介质
本申请涉及快递配送管理
,具体涉及一种件量预测方法及装置、设备和存储介质。
技术介绍
对于快递行业,长期件量预测非常重要,可以支持资源调配,人员排班,高峰指挥调度等事宜。然而由于快递行业的件量变化存在着多周期性(例如周、月、季度等)、长期趋势明显、存在滞后期、不同网点间差异大、受到天气和重大节假日等外生冲击影响、具有节前节后效应等数据特征,导致预测场景非常复杂。图1为某网点的真实派件量示意图。如图1所示,该网点中,清明节、端午节、五一、十一等节假日对件量形成了向下的外生冲击,双十一、双十二等购物节对件量形成了向上的外生冲击,而春节、中秋等节日对件量形成了先向上后向下的外生冲击,等等。上述复杂场景对现有的件量预测技术产生了很大挑战,导致现有的件量预测技术的预测结果存在较大偏差。当前业界应用的件量预测方法均存在显著缺陷,其中自回归积分滑动平均模型(ARIMA)在长期预测方向会发生漂移,不能进行有效的长期预测;随机森林模型、XGboost模型、Prophet模型均未考虑时间序列的先后顺序,即时间较远的样本与较新的样本有相同的权重,无法充分利用信息,长期预测效果不佳。
技术实现思路
鉴于现有技术中的上述缺陷或不足,期望提供一种对于快递行业复杂场景的长期件量预测效果较好的件量预测方法及装置、设备和存储介质。第一方面,本专利技术提供一种件量预测方法,包括:获取历史数据,生成标注有若干快递行业特征的数据集,并从该数据集中划分出训练集和验证集;快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征;建立训练集的第一件量序列与快递行业特征的线性回归模型,提取第一线性序列信息;根据第一件量序列和第一线性序列信息获得第一残差序列信息,并根据第一残差序列信息生成周期池;将验证集的第二件量序列输入线性回归模型以提取第二线性序列信息;根据第二件量序列和第二线性序列信息获得第二残差序列信息,并根据周期池提取第二残差序列信息的若干周期序列以检验第二残差序列信息是否具有周期性:是,则通过状态空间模型从第二残差序列信息中提取周期效应与滞后期信息,根据第二线性序列信息和周期效应与滞后期信息生成第二预测结果并输出。第二方面,本专利技术提供一种件量预测装置,包括数据集配置单元、第一线性提取单元、周期池生成单元、第二线性提取单元、周期性检验单元和第二预测单元。数据集配置单元配置用于获取历史数据,生成标注有若干快递行业特征的数据集,并从数据集中划分出训练集和验证集。其中,快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征。第一线性提取单元配置用于建立训练集的第一件量序列与快递行业特征的线性回归模型,提取第一线性序列信息。周期池生成单元配置用于根据第一件量序列和第一线性序列信息获得第一残差序列信息,并根据第一残差序列信息生成周期池。第二线性提取单元配置用于将验证集的第二件量序列输入线性回归模型以提取第二线性序列信息。周期性检验单元配置用于根据第二件量序列和第二线性序列信息获得第二残差序列信息,并根据周期池提取第二残差序列信息的若干周期序列以检验第二残差序列信息是否具有周期性。第二预测单元配置用于在第二残差序列信息具有周期性时通过状态空间模型从第二残差序列信息中提取周期效应与滞后期信息,根据第二线性序列信息和周期效应与滞后期信息生成第二预测结果并输出。第三方面,本专利技术还提供一种设备,包括一个或多个处理器和存储器,其中存储器包含可由该一个或多个处理器执行的指令以使得该一个或多个处理器执行根据本专利技术各实施例提供的件量预测方法。第四方面,本专利技术还提供一种存储有计算机程序的计算机可读存储介质,该计算机程序使计算机执行根据本专利技术各实施例提供的件量预测方法。本专利技术诸多实施例提供的件量预测方法及装置、设备和存储介质通过在数据集中标注长期趋势特征,通过线性回归模型提取表征长期趋势和外生冲击的线性信息,并在剩余的残差序列信息具有周期性时提取表征周期性和滞后期的非线性信息,最终实现了效果较好的长期件量预测;本专利技术一些实施例提供的件量预测方法及装置、设备和存储介质进一步通过利用训练集的残差序列信息所生成的功率谱图确定功率谱图周期,再综合根据经验获知的快递行业常用周期生成周期池,保障周期池的准确性和全面性,进而保障了预测效果;本专利技术一些实施例提供的件量预测方法及装置、设备和存储介质进一步通过对提取周期效应与滞后期信息后的第三残差序列信息进行白噪声检验以判断是否完全提取所有有效信息,并在未完全提取时返回优化线性回归模型或提取误差信息,以进一步保障预测的准确性;本专利技术一些实施例提供的件量预测方法及装置、设备和存储介质进一步通过以MAPE为评估标准采用测试集对预测效果进行评估,从而对预测效果作出客观评估。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为某网点的真实派件量示意图。图2为本专利技术一实施例提供的件量预测方法的流程图。图3为图2所示方法中所提取的第二线性序列信息的示意图。图4为图2所示方法中所提取的周期效应与滞后期信息的示意图。图5为图2所示方法中所输出的第二预测结果与真实派件量的对比示意图。图6为图2所示方法的一种优选实施方式的流程图。图7为图2所示方法的一种优选实施方式中步骤S10的流程图。图8为图7所示步骤S10的一种优选实施方式的流程图。图9为图2所示方法的一种优选实施方式中步骤S30的流程图。图10为图9所示方法中所生成的功率谱图。图11为图2所示方法的一种优选实施方式中步骤S50的流程图。图12为图2所示方法的一种优选实施方式中步骤S70的流程图。图13为图2所示方法的一种优选实施方式的流程图。图14为本专利技术一实施例提供的件量预测装置的结构示意图。图15为图14所示装置的一种优选实施方式的结构示意图。图16为本专利技术一实施例提供的一种设备的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图2为本专利技术一实施例提供的件量预测方法的流程图。如图2所示,在本实施例中,本专利技术提供的件量预测方法包括:S10:获取历史数据,生成标注有若干快递行业特征的数据集,并从该数据集中划分出训练集和验证集;快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征;S20:建立训练集的第一件量序列与快递行业特征的线性回归模型,提取第一线性序列信息;S30:根据第一件量序列和第一线性序列信息获得第一残差序列信息,并根据第一残差序列信息生成周期池;S40:将验证集的第二件量序列输入线性回归模型以提取第二线性序列信息;S50:根据第二件量序列和第二线性序列信息获得第二残差序列信息,并根据周期池提取第二残差序列信息的若干周期序列以检验第二残差序列信息是否具有周期性:是,则进入步骤S70:通过状态空间模型本文档来自技高网...

【技术保护点】
1.一种件量预测方法,其特征在于,包括:获取历史数据,生成标注有若干快递行业特征的数据集,并从所述数据集中划分出训练集和验证集;所述快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征;建立所述训练集的第一件量序列与所述快递行业特征的线性回归模型,提取第一线性序列信息;根据所述第一件量序列和所述第一线性序列信息获得第一残差序列信息,并根据所述第一残差序列信息生成周期池;将所述验证集的第二件量序列输入所述线性回归模型以提取第二线性序列信息;根据所述第二件量序列和所述第二线性序列信息获得第二残差序列信息,并根据所述周期池提取所述第二残差序列信息的若干周期序列以检验所述第二残差序列信息是否具有周期性:是,则通过状态空间模型从所述第二残差序列信息中提取周期效应与滞后期信息,根据所述第二线性序列信息和所述周期效应与滞后期信息生成第二预测结果并输出。

【技术特征摘要】
1.一种件量预测方法,其特征在于,包括:获取历史数据,生成标注有若干快递行业特征的数据集,并从所述数据集中划分出训练集和验证集;所述快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征;建立所述训练集的第一件量序列与所述快递行业特征的线性回归模型,提取第一线性序列信息;根据所述第一件量序列和所述第一线性序列信息获得第一残差序列信息,并根据所述第一残差序列信息生成周期池;将所述验证集的第二件量序列输入所述线性回归模型以提取第二线性序列信息;根据所述第二件量序列和所述第二线性序列信息获得第二残差序列信息,并根据所述周期池提取所述第二残差序列信息的若干周期序列以检验所述第二残差序列信息是否具有周期性:是,则通过状态空间模型从所述第二残差序列信息中提取周期效应与滞后期信息,根据所述第二线性序列信息和所述周期效应与滞后期信息生成第二预测结果并输出。2.根据权利要求1所述的方法,其特征在于,所述获取历史数据,生成标注有若干快递行业特征的数据集,并从所述数据集中划分出训练集和验证集包括:获取历史数据,将所述历史数据存储为原始数据集;将所述原始数据集导入节假日模板,生成标注有若干快递行业特征的数据集;将所述数据集划分为训练集、验证集和测试集。3.根据权利要求2所述的方法,其特征在于,所述获取历史数据,将所述历史数据存储为原始数据集之前还包括:生成标注有若干快递行业特征的节假日模板;所述长期趋势特征包括以下至少一项:日趋势指数、周趋势指数、月趋势指数、季度趋势指数、年趋势指数、周期趋势指数;所述节假日特征包括以下至少一项:节假日名称、是否节假日、是否节前、是否节后、是否调休日;所述购物节特征包括以下至少一项:购物节名称、是否购物节、是否购物节前、是否购物节后;所述其它外生冲击特征包括以下至少一项:天气、是否网点工作日、是否某大客户工作日。4.根据权利要求1-3任一项所述的方法,其特征在于,还包括:在所述第二残差序列信息不具有周期性时,优化所述线性回归模型,生成第一预测结果并输出。5.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述第一件量序列和所述第一线性序列信息获得第一残差序列信息,并根据所述第一残差序列信息生成周期池包括:根据所述第一件量序列和所述第一线性序列信息获得第一残差序列信息;根据所述第一残差序列信息生成功率谱图以筛选出若干预定范围内的功率谱图周期;根据各所述功率谱图周期和若干快递行业常用周期生成周期池。6.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述周期池提取所述第二残差序列信息的若干周期序列以检验所述第二残差序列信息是否具有周期性包括:根据所述周期池生成若干周期序列,对各周期序列进行排列组合,并筛选出各周期序列组合中平均绝对百分误差值(MAPE)最小的若干周期序列组合;判断筛选出的各周期序列组合的MAPE是否相同:是,则所述第二残差序列信息不具有周期性;否,则所述第二残差序列信息具有周期性。7.根据权利要求1-3任一项所述的方法,其特征在于,所述通过状态空间模型从所述第二残差序列信息中提取周期效应与滞后期信息,根据所述第二线性序列信息和所述周期效应与滞后期信息生成第二预测结果并输出包括:通过状态空间模型从所述第二残差序列信息中提取周期效应与滞后期信息;根据所述第二残差序列信息和所述周期效应与滞后期信息生成第三残差序列信息;对所述第三残差序列信息进行白噪声检验:检验通过,则根据所述第二线性序列信息和所述周期效应与滞后期信息生成第二预测结果并输出;检验失败,则返回优化所述线性回归模型,或,从所述第三残差序列信息中提取误差信息并结合所述第二线性序列信息和所述周期效应与滞后期信息生成第三预测结果并输出。8.根据权利要求2或3所述的方法,其特征在于,还包括:根据所述测试集的第三件量序列与所输出预测结果的平均绝对百分误差值(MAPE)评估预测效果。9.一种件量预测装置,其特征在于,包括:数据集配置单元,配置用于获取历史数据,生成标注有若干快递行业特征的数据集,并从所述数据集中划分出训练集和验证集;所述快递行业特征包括长期趋势特征,以及以下至少一项:节假日特征、购物节特征和其它外生冲击特征;第一线性提取单元,配置用于建立所述训练集的第一件量序列与所述快递...

【专利技术属性】
技术研发人员:王本玉许颖聪金晶
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1