当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于ARMA模型的短期车辆使用量预测方法技术

技术编号:18940456 阅读:22 留言:0更新日期:2018-09-15 11:03
本发明专利技术公开了一种基于ARMA模型的短期车辆使用量预测方法,首先对历史的车辆使用量数据进行数据清洗,然后进行属性构造,接着把星期作为周期性指标,确定ARMA模型的阶数,再后使用车辆使用量的历史数据对ARMA模型拟合,获得确定的ARMA模型,通过该ARMA模型获得未来若干天的车辆使用量预测情况,为车辆运营商的投放提供指导意见。本发明专利技术预测车辆使用量的ARMA模型也是在不断调整优化的,保证了ARMA模型的有效性,为短期预测的车辆使用量具备实际指导价值;同时本发明专利技术使用模型预测结果与历史真实数据的均方误差来评价模型的可靠性,从而量化模型的拟合好坏,实现科学调整模型参数。

A short-term vehicle usage prediction method based on ARMA model

The invention discloses a short-term vehicle usage forecasting method based on ARMA model. First, the historical vehicle usage data are cleaned, then the attributes are constructed, and then the order of the ARMA model is determined by taking the week as a periodic index, and then the ARMA model is fitted with the historical vehicle usage data. The ARMA model is obtained, and the forecast of vehicle usage in the next few days is obtained through the ARMA model, which provides guidance for vehicle operators. The ARMA model for forecasting vehicle usage in the invention is also constantly adjusted and optimized to ensure the validity of the ARMA model and has practical guiding value for short-term forecasting vehicle usage. Meanwhile, the ARMA model reliability is evaluated by the mean square error between the forecasting result of the model and the historical real data, so as to quantify the simulation of the model. It is good or bad to realize scientific adjustment of model parameters.

【技术实现步骤摘要】
一种基于ARMA模型的短期车辆使用量预测方法
本专利技术属于概率统计及短期预测
,具体涉及一种基于ARMA模型的短期车辆使用量预测方法。
技术介绍
车辆使用量是评价用户使用车辆频次的重要指标,可以直观反映出区域内对车辆需求的强弱程度,也是用于指导运营商对该区域内车辆投放量的主要依据来源,因此预测出某一区域短期内的车辆使用量对运营商有着实际的指导价值。自回归滑动平滑模型(Autoregressivemovingaveragemodel,ARMA),也称为Box-Jenkins模型,它是由自回归模型(Autoregressivemodel,AR)和移动平均模型(Movingaveragemodel,MA)结合而成,是一种经典的时间序列分析方法,已被广泛应用于经济分析和市场预测领域。AR模型模拟的是目前的观测水平会取决于其滞后的观测水平,它反映了经济变量的当前值与其过去值的关系。AR模型是仅用它的过去值及随机扰动向所建立起来的模型。因此,p阶AR模型的定义AR(p)可见公式(1):其中:如果则称为中心化AR(p)模型。由公式(1)可知,Xt的取值是前p期Xt-1,Xt-2,…,Xt-p的多元线性回归,意味着当前取值受过去p期序列之的影响,误差项εt代表的是零均值白噪声序列。MA模型描述的是自回归部分的误差累计,它反映了经济变量当前值与当前及过去误差项的关系。因此,q阶MA模型的定义MA(q)可见公式(2):其中:c是Yt的均值,εt是当期的随机干扰误差项即零均值白噪声序列,θi是模型的参数,εt-i是前i期的扰动项,因此当期的随机干扰是前q期的随机扰动εt-1,εt-2,…,εt-q的多元线性函数。ARMA模型就是AR模型和MA模型的结合,一般适用于均值为0的平稳正态过程,于是可以从公式(1)和公式(2)推导出含有p阶自回归项和q阶移动平均项的ARMA(p,q)模型的可表示为公式(3):ARMA模型是基于序列围绕某一水平随机波动为基础建立的,对于非平稳性时间序列可以通过一次或多次差分的方式变成平稳性时间序列;ARMA模型表明了一个随机时间序列可以由自身的过去或滞后值以及随机扰动项来解释。
技术实现思路
鉴于上述,本专利技术提供了一种基于ARMA模型的短期车辆使用量预测方法,其基于车辆使用量的历史数据,通过ARMA模型短期预测出未来几天车辆的使用量情况,为运营商的车辆投放量提供参考意见。一种基于ARMA模型的短期车辆使用量预测方法,包括如下步骤:(1)采集获取大量运营车辆的历史使用数据,包括车辆GPS数据、用户租用时间、车辆租用频次以及车辆运营数据,保留其中距离当前时间一年以内的历史使用数据加入至数据库中;(2)对数据库中的历史使用数据进行预处理,包括对缺失值和异常值的处理、数据清洗、属性构造以及周期性分析;(3)对预处理后车辆的历史使用数据进行平稳性检验和白噪声检验;(4)根据自相关函数图像和偏自相关函数图像确定ARMA模型的自回归项阶数p和移动平均项阶数q,进而使用通过检验后的车辆历史使用数据对ARMA模型进行训练拟合;(5)最后,利用训练拟合完成得到的ARMA模型对未来短期内的车辆使用量进行预测。进一步地,所述步骤(2)中对缺失值和异常值的处理,包括对于个别日期存在数据缺失的情况,需要对这些日期进行数据填充即将这些日期对应的车辆使用量置为0,同时对于个别日期存在数据异常的情况,同样将这些日期对应的车辆使用量置为0。进一步地,所述步骤(2)中的数据清洗即对历史使用数据中无效的数据进行滤除,保留关键的车辆运营数据;属性构造即根据历史使用数据统计出车辆每日租用量和每月租用量两个新属性;周期性分析即以一个星期作为周期,分析车辆租用量是否存在周期性变化。进一步地,所述步骤(3)中的平稳性检验即采用ADF(AugmentDickey-Fuller)单位根进行平稳性检验,要求统计量对应的概率值P>0.05时通过检验,否则车辆的历史使用数据不平稳,需要先进行差分运算后再进行ADF检验,直到车辆的历史使用数据为平稳的随机时间序列为止。进一步地,所述步骤(3)中的白噪声检验即采用Ljung-Box检验,要求统计量对应的概率值P<0.05,则确定车辆的历史使用数据为非白噪声数据。进一步地,所述步骤(4)中确定ARMA模型的自回归项阶数p和移动平均项阶数q,采用的是低阶向高阶逐步试探,即根据自相关函数图像和偏自相关函数图像计算ARMA模型对应的AIC(Akaikeinformationcriterion,赤池信息量准则),取AIC最小对应的p和q作为ARMA模型的自回归项阶数p和移动平均项阶数q,从而确立待训练拟合的ARMA模型。进一步地,所述步骤(4)在训练ARMA模型的过程中需要计算ARMA模型的预测结果与车辆使用量真实值之间的均方误差,若该均方误差大于设定的阈值,则以车辆使用量发生时间为指标,使发生时间距离当前时间越近的车辆使用量权重越高,发生时间距离当前时间越远的车辆使用量权重越低,通过调节相应的权重再次输入数据对ARMA模型进行训练拟合;若该均方误差小于设定的阈值,则完成对ARMA模型的训练。本专利技术利用ARMA模型可以预测出未来若干天的车辆使用量情况,为车辆运营商的投放提供指导意见。预测车辆使用量的ARMA模型并不是固化的模型,随着时间的推移,新的历史数据会加入到数据库中,过于久远的历史数据会被剔除,每一天拟合ARMA模型的数据都是截至当前最新的,因此预测车辆使用量的ARMA模型也是在不断调整优化的,保证了ARMA模型的有效性,为短期预测的车辆使用量具备实际指导价值。本专利技术使用模型预测结果与历史真实数据的均方误差来评价模型的可靠性,从而量化模型的拟合好坏,实现科学调整模型参数。因此,本专利技术具有以下有益技术效果:(1)本专利技术采用的车辆使用量数据具备明显的时序数据特征,车辆使用量的数据都是截至当天最新的数据,过期数据将被去除避免给预测带来影响,因此出来的拟合ARMA模型是实时更新的车辆预测模型,可对车辆运营商的投放量予以指导,辅助资源的合理分配利用。(2)本专利技术ARMA模型考虑了自身的过去或滞后值以及随机扰动项,对平稳性时间序列具备较良好的短期预测效果,而且易于实现;同时采用AIC准则确定模型阶数,均方误差值来评判拟合效果,为ARMA模型的准确性和可靠性提供了评判的依据。附图说明图1为本专利技术预测车辆使用量的模型处理流程图。图2为本专利技术ARMA模型的建模与应用流程图。具体实施方式为了更为具体地描述本专利技术,下面结合附图及具体实施方式对本专利技术的技术方案进行详细说明。本专利技术主要应用于固定区域内如景区、学校、商场等车辆使用量的短期预测,通过对最近历史车辆使用量的数据建立具体的ARMA模型,对未来若干天的车辆使用量情况进行短期预测。本专利技术预测车辆使用量的模型处理流程如图1所示分为4个部分,分别是数据抽取、数据探索与预处理、建模与应用和结果与反馈。步骤1:采集运营车辆的GPS数据、用户租用车辆的运营数据、用户租用时间数据、租用车辆频次等基本信息。在数据抽取过程中,以用户租用车辆的运营数据的时间作为划分依据,将当天最新的数据加入到集合,对距离当前时间1年以上的数据从集合中剔除。步骤2:根据步骤1采集的数据对其进行缺失值与异常值分本文档来自技高网
...

【技术保护点】
1.一种基于ARMA模型的短期车辆使用量预测方法,包括如下步骤:(1)采集获取大量运营车辆的历史使用数据,包括车辆GPS数据、用户租用时间、车辆租用频次以及车辆运营数据,保留其中距离当前时间一年以内的历史使用数据加入至数据库中;(2)对数据库中的历史使用数据进行预处理,包括对缺失值和异常值的处理、数据清洗、属性构造以及周期性分析;(3)对预处理后车辆的历史使用数据进行平稳性检验和白噪声检验;(4)根据自相关函数图像和偏自相关函数图像确定ARMA模型的自回归项阶数p和移动平均项阶数q,进而使用通过检验后的车辆历史使用数据对ARMA模型进行训练拟合;(5)最后,利用训练拟合完成得到的ARMA模型对未来短期内的车辆使用量进行预测。

【技术特征摘要】
1.一种基于ARMA模型的短期车辆使用量预测方法,包括如下步骤:(1)采集获取大量运营车辆的历史使用数据,包括车辆GPS数据、用户租用时间、车辆租用频次以及车辆运营数据,保留其中距离当前时间一年以内的历史使用数据加入至数据库中;(2)对数据库中的历史使用数据进行预处理,包括对缺失值和异常值的处理、数据清洗、属性构造以及周期性分析;(3)对预处理后车辆的历史使用数据进行平稳性检验和白噪声检验;(4)根据自相关函数图像和偏自相关函数图像确定ARMA模型的自回归项阶数p和移动平均项阶数q,进而使用通过检验后的车辆历史使用数据对ARMA模型进行训练拟合;(5)最后,利用训练拟合完成得到的ARMA模型对未来短期内的车辆使用量进行预测。2.根据权利要求1所述的短期车辆使用量预测方法,其特征在于:所述步骤(2)中对缺失值和异常值的处理,包括对于个别日期存在数据缺失的情况,需要对这些日期进行数据填充即将这些日期对应的车辆使用量置为0,同时对于个别日期存在数据异常的情况,同样将这些日期对应的车辆使用量置为0。3.根据权利要求1所述的短期车辆使用量预测方法,其特征在于:所述步骤(2)中的数据清洗即对历史使用数据中无效的数据进行滤除,保留关键的车辆运营数据;属性构造即根据历史使用数据统计出车辆每日租用量和每月租用量两个新属性;周期性分析即以一个星期作为周期,分析车辆租用量是否存在周期性变化。4.根据权利要求1所述的短...

【专利技术属性】
技术研发人员:杨国青吕攀王杰杨晓声李红吴朝晖
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1