一种非平稳时间序列数据的多维度扩充预测方法与装置制造方法及图纸

技术编号:25599741 阅读:35 留言:0更新日期:2020-09-11 23:57
本发明专利技术涉及一种非平稳时间序列数据的多维度扩充预测方法与装置,包括以下步骤:收集原始抄表数据,对原始抄表数据进行加工,扩展数据维度构造抄表数据集;构建不同序列依赖长度的RNN序列表达模型,采用全量数据进行模型训练,依据模型性能表现确定最优化依赖长度;以最佳序列依赖长度建立RNN序列模型,以抄表数据集为基础,进行模型训练,获得优化后的RNN序列模型参数;使用所述优化后的RNN序列模型参数对各个表具的最新远传数据进行预测;将预测的远传数据值与实际远传数据值进行对比,依据策略得到校正值,并将校正值记录入库。本发明专利技术能够对非平稳时间序列进行建模,同时能融合差异性时间步长的信息维度,使得时间序列模型具备更强的表达能力。

【技术实现步骤摘要】
一种非平稳时间序列数据的多维度扩充预测方法与装置
本专利技术涉及时间序列数据预测
,特别涉及一种非平稳时间序列数据的多维度扩充预测方法与装置。
技术介绍
现有对时间序列数据相关的回归分析方法中,多以固定时间间隔为基础进行平稳性时间序列数据处理与预测,无法对数据中时间间隔不规则的情形进行处理。同时,经典时间序列模型建模维度主要集中在时间绝对刻度和采样值维度,缺乏对不规则时间间隔差异性等其他信息维度的建模,模型在特征提取过程中层次与深度不足,模型表达能力具备一定限制,不能胜任复杂条件下的时间序列预测任务。
技术实现思路
本专利技术的目的在于改善现有技术中所存在的不足,提供一种非平稳时间序列数据的多维度扩充预测方法与装置,能够对非平稳时间序列进行建模,同时能融合差异性时间步长的信息维度,具备更强表达能力的时间序列处理模型。为了实现上述专利技术目的,本专利技术实施例提供了以下技术方案:一种非平稳时间序列数据的多维度扩充预测方法,包括以下步骤:步骤S1:收集原始抄表数据,对原始抄表数据进行加工,扩展数据维度构造抄表数据集;步骤S2:构建不同序列依赖长度的RNN序列表达模型,采用全量数据进行模型训练,依据模型性能表现确定最优化依赖长度;步骤S3:以最佳序列依赖长度建立RNN序列模型,以抄表数据集为基础,进行模型训练,获得优化后的RNN序列模型参数;步骤S4:使用所述优化后的RNN序列模型参数对各个表具的最新远传数据进行预测;步骤S5:将预测的远传数据值与实际远传数据值进行对比,依据策略得到校正值,并将校正值记录入库。更进一步地,为了详细说明收集原始抄表数据,对原始抄表数据进行加工,扩展数据维度构造抄表数据集的步骤,所述步骤S1具体包括以下步骤:步骤S1-1:收集表具的远传数据和人工抄表数据作为原始抄表数据,并扩展所述原始抄表数据的维度;所述扩展后的原始抄表数据的维度包括表号、抄表时间、抄表读数;步骤S1-2:对原始抄表数据的抄表时间进行粒度处理,将远传数据和人工抄表数据在时间粒度上对齐,并扩展所述抄表时间的维度,所述抄表时间的维度包括季节、节假日;步骤S1-3:将所述在时间粒度上对齐的原始抄表数据进行一阶差分,获得用气量数据,构成抄表数据集。更进一步地,为了详细说明所述抄表数据集的作用,所述抄表数据集包括全表数据集、单表数据集;所述全表数据集用于进行预测模型选择、超参数调整的训练任务;所述单表数据集用于在预测模型选择的基础上对表具进行定向参数优化。更进一步地,为了详细说明构建不同序列依赖长度的RNN序列表达模型,采用全量数据进行模型训练,依据模型性能表现确定最优化依赖长度的步骤,所述步骤S2具体包括以下步骤:步骤S2-1:构建RNN序列表达模型,利用GRU单元和RNN结构减缓RNN序列表达模型的梯度消失,使用注意力机制调整预测输出所依赖的序列数据之间的动态权重关系;步骤S2-2:依据所述全表数据集确定RNN序列表达模型的依赖长度,选择综合误差最小的依赖长度作为最终的依赖长度。更进一步地,所述步骤S3具体包括以下步骤:依据所述最终依赖长度为超参数,为个表具建立RNN序列模型,以个表具的单表数据集训练模型,获得优化后的RNN序列模型及参数。一种非平稳时间序列数据的多维度扩充预测装置,包括:数据整合与预处理组件,用于收集原始抄表数据,对原始抄表数据进行加工,扩展数据维度构成抄表数据集供离线模型设计选型组件和半在线模型训练组件使用;离线模型设计选型组件,用于构建不同序列依赖长度的RNN序列表达模型,采用全量数据进行模型训练,依据模型性能表现确定最优化依赖长度;半在线模型训练组件,用于以最佳序列依赖长度建立RNN序列模型,以所述单表数据集为基础,进行模型训练,获得各个表具优化后的RNN序列模型参数;在线预测组件,用于使用优化后的RNN序列模型参数对各个表具的最新远传数据进行预测;数据对比与校正组件,用于将预测的远传数据值与实际远传数据值进行对比,依据策略得到校正值,并将校正值记录入库。与现有技术相比,本专利技术的有益效果:本专利技术能够对非平稳时间序列进行建模,同时能融合差异性时间步长的信息维度,使得时间序列处理模型具备更强的表达能力。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本专利技术预测方法流程图;图2为本专利技术预测装置模块示意图。具体实施方式下面将结合本专利技术实施例中附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性,或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。实施例1:本专利技术通过下述技术方案实现,如图1所示,一种非平稳时间序列数据的多维度扩充预测方法,包括以下步骤:步骤S1:收集原始抄表数据,对原始抄表数据进行加工,扩展数据维度构造抄表数据集。收集表具的原始抄表数据由表具的远传数据和人工抄表数据两部分组成,该原始抄表数据具有时间步长上的差异性,属于非平稳的时间序列。将原始抄表数据的维度进行扩展,所述扩展后的原始抄表数据的维度包括表号、抄表时间、抄表读数。对扩展后的原始抄表数据的抄表时间进行粒度处理,将远传数据和人工抄表数据在时间粒度上对齐,并扩展所述抄表时间的维度,所述扩展后的抄表时间的维度包括季节、节假日。将所述在时间粒度上对齐的原始抄表数据进行一阶差分,获得用气量数据,这些用气量数据构成了抄表数据集。需要说明的是,该抄表数据集包括全表数据集、单表数据集,所述全表数据集用于后续进行预测模型选择、超参数调整等的训练任务,所述单表数据集用于在预测模型选择的基础上对表具进行定向参数优化。步骤S2:构建不同序列依赖长度的RNN序列表达模型,采用全量数据进行模型训练,依据模型性能表现确定最优化依赖长度。在构建RNN序列表达模型时,利用GRU单元和RNN结构可以减缓RNN序列表达模型的梯度消失,使用注意力机制调整本文档来自技高网...

【技术保护点】
1.一种非平稳时间序列数据的多维度扩充预测方法,其特征在于:包括以下步骤:/n步骤S1:收集原始抄表数据,对原始抄表数据进行加工,扩展数据维度构造抄表数据集;/n步骤S2:构建不同序列依赖长度的RNN序列表达模型,采用全量数据进行模型训练,依据模型性能表现确定最优化依赖长度;/n步骤S3:以最佳序列依赖长度建立RNN序列模型,以抄表数据集为基础,进行模型训练,获得优化后的RNN序列模型参数;/n步骤S4:使用所述优化后的RNN序列模型参数对各个表具的最新远传数据进行预测;/n步骤S5:将预测的远传数据值与实际远传数据值进行对比,依据策略得到校正值,并将校正值记录入库。/n

【技术特征摘要】
1.一种非平稳时间序列数据的多维度扩充预测方法,其特征在于:包括以下步骤:
步骤S1:收集原始抄表数据,对原始抄表数据进行加工,扩展数据维度构造抄表数据集;
步骤S2:构建不同序列依赖长度的RNN序列表达模型,采用全量数据进行模型训练,依据模型性能表现确定最优化依赖长度;
步骤S3:以最佳序列依赖长度建立RNN序列模型,以抄表数据集为基础,进行模型训练,获得优化后的RNN序列模型参数;
步骤S4:使用所述优化后的RNN序列模型参数对各个表具的最新远传数据进行预测;
步骤S5:将预测的远传数据值与实际远传数据值进行对比,依据策略得到校正值,并将校正值记录入库。


2.根据权利要求1所述的一种非平稳时间序列数据的多维度扩充预测方法,其特征在于:所述步骤S1具体包括以下步骤:
步骤S1-1:收集表具的远传数据和人工抄表数据作为原始抄表数据,并扩展所述原始抄表数据的维度;所述扩展后的原始抄表数据的维度包括表号、抄表时间、抄表读数;
步骤S1-2:对原始抄表数据的抄表时间进行粒度处理,将远传数据和人工抄表数据在时间粒度上对齐,并扩展所述抄表时间的维度,所述抄表时间的维度包括季节、节假日;
步骤S1-3:将所述在时间粒度上对齐的原始抄表数据进行一阶差分,获得用气量数据,构成抄表数据集。


3.根据权利要求2所述的一种非平稳时间序列数据的多维度扩充预测方法,其特征在于:所述抄表数据集包括全表数据集、单表数据集;所述全表数据集用于进行预测模型选择、超参数调整的训练任务;所述单表数据集用于在预测模型选择的基础上对表具进行定向参数优化...

【专利技术属性】
技术研发人员:常关羽赵勇张彬胡芸华朱炼牛富增
申请(专利权)人:成都千嘉科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1