一种基于ARMA和回归分析的生活能源消费预测方法及系统技术方案

技术编号:19481387 阅读:142 留言:0更新日期:2018-11-17 10:41
本发明专利技术公开了一种基于ARMA和回归分析的生活能源消费预测方法及系统,获取人均生活能源消费项目及其测量值;建立与人均生活能源消费测量值相对应的第一样本,构建时间序列;根据贝叶斯信息量准则,确定ARMA模型的阶数,构造ARMA模型;建立以现实因素的影响因子与时间序列的样本集合为第二样本;对第二样本进行回归分析,得到组合预测模型;利用组合预测模型对时间序列进行组合预测。本发明专利技术采用基于ARMA和回归分析的组合机器学习预测模型,能更好地适应时间序列的特性并准确描述现实影响因素,具有测试准确度高的有益效果。

【技术实现步骤摘要】
一种基于ARMA和回归分析的生活能源消费预测方法及系统
本专利技术涉及能源预测数据挖掘领域,具体涉及一种基于ARMA和回归分析的生活能源消费预测方法及系统。
技术介绍
能源在经济发展中占有重要的地位,是影响国家战略和政策的重要因素。近年来,中国能源工业的蓬勃发展为中国经济增长提供了源源不断的动力,但在能源工业发展过程中,人均能源不足、能源利用效率低、环境污染严重等问题日益凸显,为此需要对我国的能源结构和能源消费进行调整和控制,而对人均生活能源消费进行预测,有助于制定合理的能源调控措施,对经济和环境的健康发展有着重要意义。目前对于能源的预测多采用时间序列法,时间序列法通过寻找历史数据中的潜在规律,对未来数据进行预测,但单一的时间序列模型在预测非线性的混沌序列时,预测结果往往具有较大的误差。此外,实际条件下的时间序列在某一时刻的值不仅取决于自身的变化规律,还受到人口、经济等因素的影响,而时序模型无法描述现实影响因素的特征信息。综上所述,现有技术中对于预测结果误差大,时序模型无法描述现实影响因素的问题,尚缺乏有效的解决方案。
技术实现思路
为了克服上述现有技术的不足,本专利技术提供了一种基于ARMA和回归分析的生活能源消费预测方法及系统,采用基于ARMA和回归分析的组合机器学习预测模型,能更好地适应时间序列的特性并准确描述现实影响因素,具有测试准确度高的有益效果。本专利技术所采用的技术方案是:一种基于ARMA和回归分析的生活能源消费预测方法,该方法包括以下步骤:获取人均生活能源消费项目及其测量值;建立与人均生活能源消费测量值相对应的第一样本,构建时间序列;根据贝叶斯信息量准则,确定ARMA模型的阶数,构造ARMA模型;建立以现实因素的影响因子与时间序列的样本集合为第二样本;对第二样本进行回归分析,得到组合预测模型;利用组合预测模型对第一样本进行组合预测。进一步的,还包括对人均生活能源消费测量值进行筛选,剔除人均生活能源消费量中的缺失值;对人均生活能源消费测量值中的测量缺失值进行拟合,对经筛选和拟合后的人均生活能源消费测量值进行格式转换的步骤。进一步的,所述时间序列的构建方法为:建立与人均生活能源消费测量值相对应的第一样本,将第一样本作为初始序列;对初始序列进行k阶差分运算,得到基于人均生活能源消费项目且满足平稳性要求的时间序列。进一步的,若初始序列不是平稳序列,则需要对初始序列做k阶差分运算,k是使序列满足平稳性要求的最小差分运算次数;若初始序列满足平稳性要求,则不需要做差分运算,此时k值为0。进一步的,所述对第二样本进行回归分析的方法包括:将现实因素的影响因子和时间序列作为回归分析的自变量,将时间序列某一时刻的取值作为回归分析的因变量进行函数拟合,得到若干个回归分析样本,建立回归分析样本集;从回归分析样本集中随机选取3个样本作为验证集,其余样本作为训练集对回归分析模型进行训练;比较每个回归分析模型在验证集上的相对误差,取相对误差最小的前三个模型构建组合预测模型,所述组合预测模型包括ARMA模型、支持向量机回归模型和岭回归模型。进一步的,按顺序在时间序列上截取长度为n的部分序列作为时间序列自变量的值,步长为1,n为回归分析中时间序列自变量的数量。进一步的,所述利用组合预测模型对第一样本进行组合预测的方法包括:利用ARMA模型、支持向量机回归模型和岭回归模型对第一样本进行预测,得到三个模型的预测结果,将三个模型的预测结果分配一定权值并进行加权平均,得到最终的预测结果。进一步的,所述权值的计算方法为:其中,τi表示含有均值和标准差的模型契合度,i的取值为1,2,3,ωi表示模型的权值。进一步的,所述含有均值和标准差的模型契合度的计算函数为:其中,σ和μ分别表示验证集真实值的标准差和均值;ξi表示模型i在验证集上的相对误差,i的取值为1,2,3;σi表示模型i对验证集进行预测所得到预测值的标准差,μi表示模型i对验证集进行预测所得到的预测值的均值。一种基于ARMA和回归分析的生活能源消费预测系统,该系统包括:能源检测装置,用于获取生活能源消费项目及其测量值;及处理器,与能源消费检测装置相连,用于实现如上所述的基于ARMA和回归分析的生活能源消费预测方法;及显示单元,与处理器相连,用于输出处理器的预测结果。与现有技术相比,本专利技术的有益效果是:(1)本专利技术采用基于ARMA和回归分析的组合机器学习预测模型,更好地适应了时间序列的特性并可准确描述现实影响因素,能够对未来生活能源消费随时间变化情况进行预测,进而制定合理的能源调控措施,测试准确度高;(2)本专利技术进行最优模型筛选,通过比较每个模型在验证集上的相对误差,取相对误差最小的前三个模型构建组合预测模型,使得生活能源消费组合预测模型能更好地适应时间序列的特性,最后的预测结果由三个单模型的预测结果通过分配一定权重并进行加权平均得到,通过加权组合的方式进行预测,具有测试准确度高、可靠性强且较稳定的有益效果,明显优于传统构建组合模型的方法。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1是基于ARMA和回归分析的生活能源消费预测方法流程图;图2为本专利技术因变量和时间序列自变量图;图3为回归分析样本图;图4为模型在验证集上的相对误差图;图5为均值和标准差图;图6为本专利技术预测值和真实值图。具体实施方式下面结合附图与实施例对本专利技术作进一步说明。应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。术语解释部分:ARMA为自回归滑动平均模型正如
技术介绍
所介绍的,现有技术中存在预测结果误差较大,时序模型无法描述现实影响因素的不足,为了解决如上的技术问题,本申请提出了一种基于ARMA和回归分析的生活能源消费预测方法及系统,更好地适应了时间序列的特性并可准确描述现实影响因素,能够对未来生活能源消费随时间变化情况进行预测,进而制定合理的能源调控措施,具有测试准确度高的有益效果。本申请的一种典型的实施方式中,如图1所示,提供了一种基于ARMA和回归分析的生活能源消费预测方法,该方法包括以下步骤:步骤101:获取人均生活能源消费项目及其测量值,并对人均生活能源消费测量值进行筛选、拟合和转换。对人均生活能源消费测量值进行筛选的步骤包括:对人均生活能源消费测量值进行筛选,剔除人均生活能源消费量中的缺失值。对人均生活能源消费测量值进行拟合的步骤包括:对人均生活能源消费测量值中的测量缺失值进行拟合。对人均生活能源消费测量值进行转换的步骤包括:对经筛选和拟合后的人均生活能源消费测量值进行格式转换。步骤102:基于人均生活能源消费测量值,构建时间序列、第二样本。时间序列的构建方法为:建立与人均生活能源消费测量值相对应本文档来自技高网
...

【技术保护点】
1.一种基于ARMA和回归分析的生活能源消费预测方法,其特征是,包括以下步骤:获取人均生活能源消费项目及其测量值;建立与人均生活能源消费测量值相对应的第一样本,构建时间序列;根据贝叶斯信息量准则,确定ARMA模型的阶数,构造ARMA模型;建立以现实因素的影响因子与时间序列的样本集合为第二样本;对第二样本进行回归分析,得到组合预测模型;利用组合预测模型对第一样本进行组合预测。

【技术特征摘要】
1.一种基于ARMA和回归分析的生活能源消费预测方法,其特征是,包括以下步骤:获取人均生活能源消费项目及其测量值;建立与人均生活能源消费测量值相对应的第一样本,构建时间序列;根据贝叶斯信息量准则,确定ARMA模型的阶数,构造ARMA模型;建立以现实因素的影响因子与时间序列的样本集合为第二样本;对第二样本进行回归分析,得到组合预测模型;利用组合预测模型对第一样本进行组合预测。2.根据权利要求1所述的基于ARMA和回归分析的生活能源消费预测方法,其特征是,还包括对人均生活能源消费测量值进行筛选,剔除人均生活能源消费量中的缺失值;对人均生活能源消费测量值中的测量缺失值进行拟合,对经筛选和拟合后的人均生活能源消费测量值进行格式转换的步骤。3.根据权利要求1所述的基于ARMA和回归分析的生活能源消费预测方法,其特征是,所述时间序列的构建方法为:建立与人均生活能源消费测量值相对应的第一样本,将第一样本作为初始序列;对初始序列进行k阶差分运算,得到基于人均生活能源消费项目且满足平稳性要求的时间序列。4.根据权利要求3所述的基于ARMA和回归分析的生活能源消费预测方法,其特征是,若初始序列不是平稳序列,则需要对初始序列做k阶差分运算,k是使序列满足平稳性要求的最小差分运算次数;若初始序列满足平稳性要求,则不需要做差分运算,此时k值为0。5.根据权利要求1所述的基于ARMA和回归分析的生活能源消费预测方法,其特征是,所述对第二样本进行回归分析的方法包括:将现实因素的影响因子和时间序列作为回归分析的自变量,将时间序列某一时刻的取值作为回归分析的因变量进行函数拟合,得到若干个回归分析样本,建立回归分析样本集;从回归分析样本集中随机选取3个样本作为验证集,其余样本作为训练集...

【专利技术属性】
技术研发人员:王红付园斌王露潼宋永强房有丽周莹狄瑞彤
申请(专利权)人:山东师范大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1