System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于电力数据治理,具体涉及一种基于时间感知扩散的电力数据缺失值补全方法及系统。
技术介绍
1、这里的陈述仅提供与本专利技术相关的
技术介绍
,而不必然地构成现有技术。
2、随着智能电网、可再生能源和电动化等技术的不断发展,电力系统正经历着数字化转型。大量传感器和监测装置被部署在电力系统中,实时采集着各种参数数据,为系统运行提供了全面的监测和控制能力。电力企业的数据资产呈现典型的大数据特征,这些电力数据来自电力生产和电能使用的发电、输电、变电、配电和调度各个环节,包括电网运行、设备管理、营销服务和企业管理等各类数据,蕴藏着反映电力企业生产经营和客户服务状况的丰富信息。
3、然而,在新型电力系统中,设备种类多、分布广、差异大,导致电网测量数据采集的不确定性增加,随机数据缺失率较高。停电会导致整个区域的电力供应中断,因此在停电期间无法记录或采集相关的电力数据,这将导致停电期间的数据丢失。停电前最后时刻的时间序列数据很可能与恢复后第一时刻的数据密切相关。对于电力数据而言,其大多数应用和算法都需要无缺失值的数据。电力数据的质量也会影响下游任务(如数据异常检测和数据分类)的效率。不良的电力数据会给后续任务带来偏差,并使后续任务的有效性受到质疑。因此,亟需基于海量电力数据挖掘潜在缺失规律,进而构建电力数据缺失值补全模型,为电力数据和下游任务质量提供有效保证。
4、近年来,随着电力数据治理
的推进,基于分数的扩散模型凭借其优异的生成性能和补全效果脱颖而出。基于分数的扩散模型是一类深度生成模型,它通
技术实现思路
1、本专利技术的目的是为了克服上述现有技术中存在的不足,提供一种基于时间感知扩散的电力数据缺失值补全方法及系统,根据收集的海量电力数据,通过构建tied-gan模型,对电力数据缺失值进行补全。
2、为了实现上述目的,本专利技术是通过如下的技术方案来实现:
3、一方面,本专利技术的技术方案提供了一种基于时间感知扩散的电力数据缺失值补全方法,包括:
4、获取电力数据并进行预处理,随机掩码一部分电力数据代表缺失值;
5、采样噪音数据,将噪音数据加入到掩码部分的电力数据上,并与未掩码的原始电力数据一同输入预先构建好的基于时间感知扩散的生成对抗模型中进行训练,得到预测噪音数据;
6、在加入噪音数据的掩码部分的电力数据中去除预测噪音数据,得到电力数据缺失值的补全结果。
7、在至少一个实施例中,所述基于时间感知扩散的生成对抗模型包括噪音预测器和判别器;所述噪音预测器用于根据加入噪音数据的掩码部分的电力数据与未掩码的原始电力数据输出预测的噪音数据;所述判别器基于噪音预测器输出的噪音数据和采样的噪音数据,判别真实的采样噪音和生成的噪音数据,辅助生成一个更好的噪音预测器。
8、在至少一个实施例中,所述噪音预测器包括时间感知变换器层和特征变换器层;根据电力数据的缺失特征,在时间感知变换器层中重写了变换器的位置编码模块,以捕捉与缺失时间间隔相关的信息;特征变换器层以每个时间点的张量为输入,学习时间依赖性。
9、在至少一个实施例中,所述判别器包括下采样卷积块、自注意力卷积块和上采样卷积块。
10、在至少一个实施例中,在进行训练时,噪音预测器的损失函数由重构误差和判别器判别结果组成。
11、在至少一个实施例中,所述噪音预测器的损失函数为:
12、;
13、式中,为重构误差,为判别器判别结果。
14、在至少一个实施例中,所述重构误差为噪音预测器输出的噪音结果与真实采样的噪音的重构误差,计算方式为:
15、;
16、式中,为原始数据,是真实采样的噪音数据,为噪音预测器生成的预测噪音数据,t为时间步;为噪音目标,为给定条件观察数据。
17、在至少一个实施例中,所述判别器判别结果计算公式为:
18、;
19、式中,是真实采样的噪音数据,为噪音预测器生成的预测噪音数据。
20、在至少一个实施例中,所述电力数据包括变电站的多变量电力数据和电力用户日常用电数据;预处理包括数据清洗、数据定义并存储;按照缺失率随机掩码一部分信息代表缺失数据;采样的噪音数据为高斯噪音。
21、另一方面,本专利技术的技术方案还提供了一种基于时间感知扩散的电力数据缺失值补全系统,包括:
22、数据获取模块,被配置为:获取电力数据并进行预处理,随机掩码一部分电力数据代表缺失值;
23、噪音数据预测模块,被配置为:采样噪音数据,将噪音数据加入到掩码部分的电力数据上,并与未掩码的原始电力数据一同输入预先构建好的基于时间感知扩散的生成对抗模型中进行训练,得到预测噪音数据;
24、数据补全模块,被配置为:在加入噪音数据的掩码部分的电力数据中去除预测噪音数据,得到电力数据缺失值的补全结果。
25、上述本专利技术的技术方案的有益效果如下:
26、(1)本专利技术根据收集的海量电力数据,通过构建tied-gan模型,对电力数据缺失值进行补全,不仅提供了完整、准确的电力数据,也保证了下游任务(例如,电力数据异常检测和电力数据分类等)的数据质量。
27、(2)本专利技术针对电力数据的时序性和长期依赖性,采用基于分数的扩散模型补全电力数据缺失值。一方面,基于分数的扩散模型强大的生成效果,保证了电力数据的生成质量。另一方面,提出的tied-gan模型针对电力数据的连续缺失特性,将时间间隔作为时间编码器的额外输入,提高了补全的准确性。
28、(3)本专利技术利用生成对抗网络的结构,在噪音预测器之后添加一个判别器,辅助生成一个效果更好的噪音预测器,从而提高了模型的补全性能。
29、本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
本文档来自技高网...【技术保护点】
1.一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,包括:
2.如权利要求1所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述基于时间感知扩散的生成对抗模型包括噪音预测器和判别器;所述噪音预测器用于根据加入噪音数据的掩码部分的电力数据与未掩码的原始电力数据输出预测的噪音数据;所述判别器基于噪音预测器输出的噪音数据和采样的噪音数据,判别真实的采样噪音和生成的噪音数据,辅助生成一个更好的噪音预测器。
3.如权利要求2所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述噪音预测器包括时间感知变换器层和特征变换器层;根据电力数据的缺失特征,在时间感知变换器层中重写了变换器的位置编码模块,以捕捉与缺失时间间隔相关的信息;特征变换器层以每个时间点的张量为输入,学习时间依赖性。
4.如权利要求2所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述判别器包括下采样卷积块、自注意力卷积块和上采样卷积块。
5.如权利要求2所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,在进行训
6.如权利要求5所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述噪音预测器的损失函数为:
7.如权利要求6所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述重构误差为噪音预测器输出的噪音结果与真实采样的噪音的重构误差,计算方式为:
8.如权利要求6所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述判别器判别结果计算公式为:
9.如权利要求1所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述电力数据包括变电站的多变量电力数据和电力用户日常用电数据;预处理包括数据清洗、数据定义并存储;按照缺失率随机掩码一部分信息代表缺失数据;采样的噪音数据为高斯噪音。
10.一种基于时间感知扩散的电力数据缺失值补全系统,其特征在于,包括:
...【技术特征摘要】
1.一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,包括:
2.如权利要求1所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述基于时间感知扩散的生成对抗模型包括噪音预测器和判别器;所述噪音预测器用于根据加入噪音数据的掩码部分的电力数据与未掩码的原始电力数据输出预测的噪音数据;所述判别器基于噪音预测器输出的噪音数据和采样的噪音数据,判别真实的采样噪音和生成的噪音数据,辅助生成一个更好的噪音预测器。
3.如权利要求2所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述噪音预测器包括时间感知变换器层和特征变换器层;根据电力数据的缺失特征,在时间感知变换器层中重写了变换器的位置编码模块,以捕捉与缺失时间间隔相关的信息;特征变换器层以每个时间点的张量为输入,学习时间依赖性。
4.如权利要求2所述的一种基于时间感知扩散的电力数据缺失值补全方法,其特征在于,所述判别器包括下采样卷积块、自注意力卷积块和上采样卷积块。
5...
【专利技术属性】
技术研发人员:史玉良,李浩宇,管永明,程林,王新军,陈志勇,孔凡玉,
申请(专利权)人:山东大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。