一种城市时空数据预测因果模型的评价方法技术

技术编号:37812428 阅读:16 留言:0更新日期:2023-06-09 09:42
本发明专利技术属于基于特定计算模型的机器学习技术领域,具体为一种城市时空数据预测因果模型的评价方法,包括构建城市时空数据预测因果模型并采用城市用电数据集进行学习,利用神经网络搭建城市时空数据预测因果模型的学习框架对城市时空数据预测因果模型进行训练,采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,本方法采用合理的训练、验证、预测评价比例,提高了评价效果。提高了评价效果。

【技术实现步骤摘要】
一种城市时空数据预测因果模型的评价方法


[0001]本专利技术属于基于特定计算模型的机器学习
,尤其是涉及城市复杂系统中时空数据的挖掘和预测用模型评价,具体为一种城市时空数据预测因果模型的评价方法。

技术介绍

[0002]城市级复杂系统可以表示为一个复杂图网络,其中空间节点表示为城市中某个区域,节点属性表示为区域随时间演化的可观测时间序列,节点之间的连接表示区域间的相互作用或交互关系。复杂系统在宏观层面上的可观测现象由中观区域间的相互作用涌现而出。为了探索并预测城市级复杂系统内部的动力学过程,大多数方法在中观层面学习区域间隐式的图网络结构,或建立区域内复杂的注意力机制以捕获的长时期时空相关性。然而,中观层面的时空数据是基于区域间的相关性在多种因素的混合影响下产生的观测结果,易受外部环境和系统噪声的干扰,从而掩盖了区域本身的特点。受中观层面自身的局限性,大多数方法停滞于研究区域间显式的相关关系,而忽略了影响区域观测生成原理的隐式因果关系,这不利于真实场景的推广和应用。
[0003]因果关系被认为是刻画观测现象生成规则的基本公理,在机器学习的背景下,正确地建模和推断因果变量和因果机制可以诱导出更稳健的特征表示,这有助于解释观测数据的生成原理。因而,采用生成因果解释模型对城市级复杂系统进行建模并进而利用其对城市电力时空数据进行预测是一种很好的解决思路。
[0004]然而,为了能使训练后的模型对城市复杂系统的时空数据进行预测的效果进行表征,需要对构建的模型进行有效的评价。如CN111488994A公开了一种正样本学习模型评估方法及装置,包括利用待评估模型对PU测试集进行打分,获取打分结果;其中,所述打分结果为所述PU测试集中每个样本被所述待评估模型判断成正样本的条件概率;所述PU测试集包含有观察到正样本和收集到的无标签样本;根据待评估模型对PU测试集的打分结果,确定所述PU测试集的AUL值。JP2022080367A公开了一种模型评估装置、模型评估方法和用于评估使用机器学习技术生成的分析模型的性能的程序。在模型评估装置中,计算单元使用要评估的分析模型通过数据分析计算预测的准确性,提取单元计算与要评估的分析模型和通用规范相关的规范信息。其他从存储库中提取链接到信息的分析模型,并且评估单元通过数据分析在待评估的分析模型和其他分析模型之间比较预测的准确性,评估分析模型的性能。
[0005]但针对城市复杂系统进行预测的生成因果解释模型有其自身的特点,包括外生变量、时空条件父变量、受控因果转移函数和时空混合函数等构成元素,现有的模型评价方法不适用于城市时空数据预测因果模型并对其进行有效评价。

技术实现思路

[0006]针对现有技术的问题,本专利技术提供了一种城市时空数据预测因果模型的评价方法。
[0007]本专利技术完整的技术方案包括:一种城市时空数据预测因果模型的评价方法,包括如下步骤:(1)构建城市时空数据预测因果模型并采用城市用电数据集进行学习,所述城市用电数据集的每一条数据包括时间、用电量和所在区域;利用神经网络搭建城市时空数据预测因果模型的学习框架,并将可识别性条件作为神经网络的约束条件,对城市时空数据预测因果模型进行训练;(2)采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,具体如下:其中,RMSE为均方根误差,MAE为平均绝对误差,MAPE为平均绝对百分比误差,表示采用训练后的城市时空数据预测因果模型预测的下一时间段用电数据,表示真实的下一时间段用电数据,N表示区域个数。
[0008]进一步的,所述城市用电数据集采用的数据源包括370个区域从2011年到2014年各区域的用电量,采样周期为15分钟。
[0009]进一步的,针对采用的数据源,以1小时的间隔分割该数据源,以获得城市用电数据集。
[0010]进一步的,将城市用电数据集中,60%的数据用于训练,20%的数据用于验证,20%的数据用于预测和评价。
[0011]进一步的,在预测时,使用过去1小时的用电历史数据来预测下一时段的用电数据。
[0012]进一步的,所述下一时段为30分钟。
[0013]进一步的,所述城市时空数据预测因果模型为生成因果解释模型;进一步的,所述生成因果解释模型包括外生变量、时空条件父变量、受控因果转移函数和时空混合函数,所述外生变量为由外部状态决定的变量,所述时空混合函数用以从所观测的城市数据中确定因果描述子,所述因果描述子为采用神经网络进行生成因果解释模型学习过程的因果隐变量,所述时空条件父变量为在可学习因果邻接矩阵中,所有与因果描述子有直接连接的变量集合,所述受控因果转移函数用以确定因果描述子的因果传播方式;具体为:
(1)式中,表示时刻各区域的观测数据,表示时刻各区域的因果描述子集合,所述因果描述子为采用神经网络进行生成因果解释模型学习过程的因果隐变量;为时空混合函数;为中的元素,表示第i个区域内在第时刻的第个因果描述子;为受控因果转移函数,表示所对应的外生变量,为受控因果转移函数的条件参数;是在特征维度上参数无关的多层感知机函数,表示对具有直接因果效应的时空条件父变量;为域信息集合的元素,表示第i个区域属于第r个域,表示影响下的第i个区域内k个外生变量的分布;进一步的,所述学习框架为Pytoch深度学习框架。包括变分自编码器、域适配器、条件生成模块(Condition Generation Module,CGM)和因果解释模块(CausalInterpretation Module,CIM),具体训练过程包括:步骤2.1:使用变分自动编码器框架来建模因果描述子的推断过程和观测数据的生成过程。GraphGRU被用作编码器和解码器,以同时处理空间和时间维度,编码器用以拟合时空混合函数,从观测数据中利用编码器推断因果描述子的后验分布,该后验分布是一个各向同性的高斯分布,编码器输出该高斯分布的均值和方差。编码器用以逼近时空混合函数的逆函数,以重参数化的方式从后验分布中采样估计的因果描述子和时空混合函数,并使用解码器从估计的因果描述子中生成各节点的重构数据。
[0014]步骤2.2:采用域适配器来从观测数据中捕获潜在的域信息,并使用Gumbel Softmax方法来确保每个节点的观测仅属于某个域。并在域信息集合的基础上确定外生变量分布。
[0015]步骤2.3:采用条件生成模块(CGM)捕捉时空因果结构。所述条件生成模块将时空因果结构分解为区域内因果关系和区域间因果关系,并使用可学习的参数矩阵对区域内因果关系和区域间因果关系进行建模。
[0016]通过将时空因果结构得到的父变量转化为因果转移函数的条件参数,是在特征维度上参数无关的多层感知机函数。
[0017]步骤2.4:采用因果解释模块,因果解释模块基于因果转换函数对因果描述子的先验分布进行建模,本专利技术使用可逆的神经样条流网络来拟合因果转换函数。
[0018本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种城市时空数据预测因果模型的评价方法,其特征在于,包括如下步骤:(1)构建城市时空数据预测因果模型并采用城市用电数据集进行学习,所述城市用电数据集的每一条数据包括时间、用电量和所在区域;利用神经网络搭建城市时空数据预测因果模型的学习框架,并将可识别性条件作为神经网络的约束条件,对城市时空数据预测因果模型进行训练;(2)采用训练后的城市时空数据预测因果模型,使用城市用电历史数据来预测下一时间段用电数据,使用均方根误差、平均绝对误差和平均绝对百分比误差三个指标来评价训练后的城市时空数据预测因果模型性能,具体如下:其中,RMSE为均方根误差,MAE为平均绝对误差,MAPE为平均绝对百分比误差,表示采用训练后的城市时空数据预测因果模型预测的下一时间段用电数据,表示真实的下一时间段用电数据,N表示区域个数。2.根据权利要求1所述的一种城市时空数据预测因果模型的评价方法,其特征在于,所述城市用电数据集采用的数据源包括从2011年到2014年各区域的用电量,区域数量为370个,用电量采样周期为15分钟。3.根据权利要求2所述的一种城市时空数据预测因果模型的评价...

【专利技术属性】
技术研发人员:邓攀赵宇闫洁刘俊廷汪慕澜
申请(专利权)人:北京市西城区科学技术和信息化局北京市西城区大数据管理局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1