多变量时间序列预测方法和系统技术方案

技术编号:16176200 阅读:239 留言:0更新日期:2017-09-09 03:28
本公开提供了一种多变量时间序列预测方法,用于预测产品数量统计信息,所述方法包括:采集至少一组与目标数据相关联的数据,所述目标数据包括数量统计信息;对所述至少一组采集的数据进行处理,得到至少一组特征数据;使用多个模型对所述特征数据进行训练,所述多个模型采用各自不同的方式对所述特征数据进行训练以得到针对所述目标数据的预测结果;以及将训练好的多个模型得到的预测结果进行组合,得到目标数据的预测结果。本公开还提供了一种多变量时间预测系统、以及一种非易失性存储介质。

【技术实现步骤摘要】
多变量时间序列预测方法和系统
本公开涉及一种多变量时间序列预测方法和一种多变量时间序列预测系统。
技术介绍
时间序列模型可以拟合并学习数据随时间变化的规律,例如周期性规律、趋势性规律或者随机性变化等,时间序列模型能够很好地考虑季节性因素、内部因素和外部因素对数据变化的影响。然而,随着工业、销售服务以及物流等各行各业的快速发展,越来越多的数据不断累积,并且随着科技的进步,获取数据的能力也在不断增强,面对对大数据的分析预测,需要可以适应大数据预测的时间序列预测方法。
技术实现思路
本公开的一个方面提供了一种多变量时间序列预测方法,用于预测产品数量统计信息,该方法包括:采集至少一组与目标数据相关联的数据,其中,目标数据包括数量统计信息。对至少一组采集的数据进行处理,得到至少一组特征数据。使用多个模型对特征数据进行训练,其中,多个模型采用各自不同的方式对特征数据进行训练以得到针对目标数据的预测结果。以及将训练好的多个模型得到的预测结果进行组合,得到目标数据的预测结果。可选地,与目标数据相关联的数据包括:外部数据,该外部数据表示影响多变量时间序列预测的系统外部数据信息,和/或内部数据,该内部数据表示影响多变量时间序列预测的系统内部数据信息。可选地,使用多个模型对特征数据进行训练是并行进行的。可选地,将训练好的多个模型得到的预测结果进行组合,包括:平均组合,对各模型的预测结果取平均值,作为目标数据的预测结果,或者加权组合,对各模型的预测结果取加权平均值,作为目标数据的预测结果。可选地,对至少一组采集数据进行处理,得到至少一组特征数据,包括,将至少一组采集的数据逐一与目标数据进行相关性和/或相似度计算,选择相关性超过阈值或者相似度超过阈值的数据作为特征数据。可选地,对至少一组采集数据进行处理,得到特征数据,还包括:对特征数据的所有非空子集进行模型预训练,得到训练结果,以及选择训练结果最优的模型对应的子集中的特征数据作为最优特征数据。相应地,使用多个模型对特征数据进行训练包括,使用多个模型对最优特征数据进行训练。可选地,对至少一组采集数据进行处理,得到特征数据,还包括:对特征数据进行不同降维比例的降维处理,得到多个降维特征数据,对多个降维特征数据进行模型预训练,得到训练结果,以及选择训练结果最优的模型对应的降维特征数据作为最优降维特征数据。相应地,使用多个模型对特征数据进行训练包括,使用多个模型对最优降维特征数据进行训练。可选地,对至少一组采集数据进行处理,得到特征数据,还包括:为特征数据中的每一组特征数据配置至少一个前置参数,在各组特征数据的不同前置参数组合下,对特征数据进行模型预训练,以及选择训练结果最优的模型对应的前置参数组合作为各组特征数据对应的最优前置参数。相应地,使用多个模型对特征数据进行训练包括,使用多个模型根据最优前置参数对特征数据进行训练。本公开的另一个方面提供了一种多变量时间序列预测系统,包括一个或多个存储器,存储有可执行指令,以及一个或多个处理器,运行可执行指令以执行如上所述的方法。本公开的另一方面提供了一种非易失性存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。附图说明为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:图1示意性示出了根据本公开实施例的多变量时间序列预测方法的流程图;图2示意性示出了根据本公开实施例的数据处理方法的流程图;图3a-图3b示意性示出了根据本公开实施例的相关性计算的示意图;以及图4示意性示出了根据本公开实施例的多变量时间序列预测系统的框图。具体实施方式以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。这里使用的词语“一”、“一个(种)”和“该”等也应包括“多个”、“多种”的意思,除非上下文另外明确指出。此外,在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。本公开的实施例提供了一种多变量时间序列预测方法,用于预测产品数量统计信息(例如,预测某产品的下个月销量、或者预测某产品下几个月的库存数量等等),该方法包括:采集至少一组与目标数据相关联的数据,其中,目标数据包括数量统计信息。对至少一组采集的数据进行处理,得到至少一组特征数据。使用多个模型对特征数据进行训练,其中,多个模型采用各自不同的方式对特征数据进行训练以得到针对目标数据的预测结果。以及将训练好的多个模型得到的预测结果进行组合,得到目标数据的预测结果。图1示意性示出了根据本公开的实施例的多变量时间序列预测方法的流程图。如图1所示,该方法包括在操作S110,采集至少一组与目标数据相关联的数据。其中,目标数据包括数量统计信息,例如,目标数据可以是某款手机的销售量,则该多变量时间序列预测方法用于预测该款手机下个时间点(例如,下周、下个月、下个季度或者下半年等)或者下几个时间点(例如,下两周、下三个月等等)的销售量。根据本公开实施例,采集至少一组与目标相关联的数据可以在不同时机采集。例如,采集与目标数据相关联的数据可以是实时采集,这样,采集得到的数据具有良好的时效性,可以为多变量时间序列预测系统提供最新的相关数据,以提高预测精度。或者例如,采集与目标数据相关联的数据可以是按照预设周期采集。例如,每隔1个小时采集一次或者每隔1天采集一次,预设周期可以根据目标数据的性质设定(例如,若目标数据的时间单位为天,则可以设置2个小时为采集周期,若目标数据的时间单位为季度,则可以设置1个月为采集周期。这样,目的性较强,效率也比较高。又例如,采集与目标数据相关联本文档来自技高网...
多变量时间序列预测方法和系统

【技术保护点】
一种多变量时间序列预测方法,用于预测产品数量统计信息,所述方法包括:采集至少一组与目标数据相关联的数据,所述目标数据包括数量统计信息;对所述至少一组采集的数据进行处理,得到至少一组特征数据;使用多个模型对所述特征数据进行训练,所述多个模型采用各自不同的方式对所述特征数据进行训练以得到针对所述目标数据的预测结果;以及将训练好的多个模型得到的预测结果进行组合,得到目标数据的预测结果。

【技术特征摘要】
1.一种多变量时间序列预测方法,用于预测产品数量统计信息,所述方法包括:采集至少一组与目标数据相关联的数据,所述目标数据包括数量统计信息;对所述至少一组采集的数据进行处理,得到至少一组特征数据;使用多个模型对所述特征数据进行训练,所述多个模型采用各自不同的方式对所述特征数据进行训练以得到针对所述目标数据的预测结果;以及将训练好的多个模型得到的预测结果进行组合,得到目标数据的预测结果。2.根据权利要求1所述的方法,其中,与所述目标数据相关联的数据包括:外部数据,所述外部数据表示影响所述多变量时间序列预测的系统外部数据信息;和/或内部数据,所述内部数据表示影响所述多变量时间序列预测的系统内部数据信息。3.根据权利要求1所述的方法,其中,所述使用多个模型对所述特征数据进行训练是并行进行的。4.根据权利要求1所述的方法,其中,所述将训练好的多个模型得到的预测结果进行组合,包括:平均组合,对各模型的预测结果取平均值,作为目标数据的预测结果;或者加权组合,对各模型的预测结果取加权平均值,作为目标数据的预测结果。5.根据权利要求1所述的方法,其中,所述对所述至少一组采集数据进行处理,得到至少一组特征数据,包括:将所述至少一组采集的数据逐一与所述目标数据进行相关性和/或相似度计算,选择相关性超过阈值或者相似度超过阈值的数据作为特征数据。6.根据权利要求5所述的方法,其中:所述对所述至少一组采集数据进行处理,得到特征数据,还包...

【专利技术属性】
技术研发人员:周子叶
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1