一种考虑局部与全局的用户负荷数据修复方法技术

技术编号：39517045 阅读：11 留言：0更新日期：2023-11-25 18:54

本发明专利技术涉及一种考虑局部与全局的用户负荷数据修复方法，属于负荷数据插补技术领域，局部插补模型利用数据点之间存在局部的相似性，基于局部相似性对缺失值进行插补；全局插补模型利用整个数据集的特征与分布信息，基于全局信息对缺失值进行插补

全部详细技术资料下载

【技术实现步骤摘要】
一种考虑局部与全局的用户负荷数据修复方法

[0001]本专利技术属于负荷数据插补
，具体涉及一种考虑局部与全局的用户负荷数据修复方法
。

技术介绍

[0002]在新一轮电力体制改革推动下，售电侧进一步放开，售电公司作为一个新兴市场主体应运而生
。
准确的用户级负荷预测对于公司掌握用户需求
、
减少偏差考核风险和提高经济效益具有重要意义
。
然而单一用户的负荷相较于系统负荷具有更强的不确定性，基于统计学的传统预测方法难以获得精确的预测结果，而深度学习方法的非线性拟合能力和泛化能力更强
,
能够获取更加精确的预测结果
。
深度学习模型是数据驱动的方法，数据的质量对模型的性能有着重要的影响
。
但是在售电公司对用户用电量数据的采集
、
传输
、
转换的过程中可能会因为采集设备故障
、
通信设备故障
、
遭受攻击等原因，导致采集数据存在缺失，数据质量不佳
。
[0003]目前对于缺失数据的处理方法可分为直接删除法和插补法
。
直接删除法虽然简单易用，但只适用于缺失值占比较小的情况，当其占比较大时，会丢失大量关键有用信息，会导致模型的效果差甚至是模型训练失败
。
插补法可以分为两类，第一类方法是基于相似的数据点进行缺失值的推断，主要包括使用简单的统计量
(
如平均值
、
中位数...

【技术保护点】

【技术特征摘要】
1.
一种考虑局部与全局的用户负荷数据修复方法，其特征在于，包括下述步骤：
S1、
首先利用
GCN
挖掘数据的局部相似性，进行局部插补；即，局部插补模型利用数据点之间存在局部的相似性，基于局部相似性对缺失值进行插补；
S2、
再基于局部插补的结果使用
GAN
的对抗训练，进行全局插补；即，全局插补模型利用整个数据集的特征与分布信息，基于全局信息对缺失值进行插补；
S3、
最后进行实验仿真，验证将局部插补与全局插补相结合对插补性能提升的有效性
。2.
根据权利要求1的一种考虑局部与全局的用户负荷数据修复方法，其特征在于，步骤
S1
具体如下：
(1)
计算相似度矩阵；将原始数据集的每一个特征向量表示为图中的一个节点，然后计算各个节点之间的相似性，构成相似矩阵，对相似矩阵进行处理后得到邻接矩阵，根据邻接矩阵即可得到图结构的数据；基于欧氏距离的相似度计算公式如下：
S
ij
＝
d(x
i
⊙
(M
i
⊙
M
j
),x
j
⊙
(M
i
⊙
M
j
))
；式中：
d
表示欧氏距离；
⊙
表示哈达玛积；
M
是二值掩码矩阵，用于表示数据是否缺失，若
M
＝0，则表示数据缺失，反之则表示数据没有缺失，
M
i
是矩阵
M
的第
i
列；通过对其最近的
K
个非缺失点的相似度进行处理，从而得到缺失点的相似度；设数据缺失点为
x
m
，其最近的
K
个非缺失点为
x
ik
，根据高斯核函数计算缺失点的相似度表达式为：式中：
σ
为高斯核函数的带宽参数；由此得到一个相对完整的相似度矩阵
S
ij
，对其进行阈值截取操作，以获得一个稀疏矩阵；对相似矩阵
S
ij
的每一行从大到小进行排序，并指定一个分位数
p
，每一行只保留排名在前
p
％的值；如下式：
(2)
构造
GCN
自编码器；自编码器由编码器和解码器组成，编码器用于将原始输入
x
映射到一个低维空间
h
＝
encode(x)
中进行中间表示，而解码器则将编码后的输入映射到原始维度空间中对输入进行重构：通过训练减少
x
与之间的误差；使用去噪自编码器；去噪自编码器接收有噪声的原始样本作为输入并对原始样本进行重构作为输出；在局部插补模型中，通过使用
dropout
层随机删除
50
％的输入后再作为去噪自编码器的输入，以完成对原始有缺失输入的重构；利用
GCN
...

【专利技术属性】
技术研发人员：沈晓东，赵俊豪，刘友波，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人