本发明专利技术公开了一种基于kmeans++的深度嵌入聚类光荷场景生成方法,获取历史实际光荷数据并进行缺值填补,对缺值填补后的历史实际光荷数据中的异常数据进行检测处理;基于kmeans++对检测后的历史实际光荷数据进行初步聚类并计算聚类指标,使用堆栈编码器对历史实际光荷数据进行降维重构,提取降维得到的空间的数据特征并计算重构损失;使用kmeans++对数据特征进行聚类得到初始聚类中心以及聚类损失,从而根据重构损失和聚类损失建立损失函数并更新聚类结果;使用均值法计算聚类结果中各聚类场景的聚类中心,即典型光荷场景。因此,将特征提取过程与聚类过程相结合,提高计算速度的同时也提高了聚类性能。时也提高了聚类性能。时也提高了聚类性能。
【技术实现步骤摘要】
基于kmeans++的深度嵌入聚类光荷场景生成方法
[0001]本专利技术涉及电网源荷的场景生成
,特别涉及基于kmeans++的深度嵌入聚类光荷场景生成方法。
技术介绍
[0002]分布式光伏上网比例不断提高,但由于光伏及负荷具有波动性和周期性,给电网规划和调度运行等工作带来了挑战。基于场景法,将光伏出力及负荷变化的不确定性转化为数个确定的典型场景,为电网的规划和优化运行提供基础。
[0003]目前场景聚类方法主要是先利用聚类算法对时序数据进行分类,然后生成典型场景,聚类算法主要包括直接聚类和间接聚类:
[0004]直接聚类包括K
‑
means,模糊C均值聚类等方法,但随着智能电表的普及,我们所得到的数据维度越来越高,由于直接聚类方法在原始空间上进行计算,受计算机算力影响,运行效率和聚类性能都较低。
[0005]间接聚类是先将数据降维,包括主成分分析,奇异值分解,自动编码器等特征提取方法,再与聚类分析相结合,通过对特征的间接聚类,提高运行效率。但目前的间接聚类在特征提取和聚类分析两个任务上是分离的,可能会导致低维空间的特征并不适合用于聚类,从而降低聚类精度。
[0006]大多场景生成方法针对的对象单一,不能充分挖掘电力数据的信息价值,且低维空间的特征表达性不足,最终降低了聚类性能。另外一些深度嵌入聚类的场景生成方法,未考虑后期聚类训练会改变嵌入空间的缺点,降低了低维特征的代表性,进而影响了最终结果。
技术实现思路
[0007]本专利技术所要解决的技术问题是:提供一种基于kmeans++的深度嵌入聚类光荷场景生成方法,能够保障低维嵌入空间特征的代表性,提高计算速度的同时也提高了聚类性能。
[0008]为了解决上述技术问题,本专利技术采用的技术方案为:
[0009]一种基于kmeans++的深度嵌入聚类光荷场景生成方法,包括步骤:
[0010]获取历史实际光荷数据并进行缺值填补,对缺值填补后的所述历史实际光荷数据中的异常数据进行检测处理;
[0011]基于kmeans++对检测后的历史实际光荷数据进行初步聚类并计算聚类指标,使用手肘法得到最佳聚类簇数;
[0012]使用堆栈编码器对所述历史实际光荷数据进行降维重构,提取降维得到的空间的数据特征并计算重构损失;
[0013]基于kmeans++对所述数据特征进行聚类,得到初始聚类中心及其聚类损失,根据所述重构损失和聚类损失建立损失函数,使用所述损失函数更新聚类结果;
[0014]使用均值法计算所述聚类结果中各聚类场景的聚类中心,将所述各聚类场景的聚
类中心作为光荷场景。
[0015]本专利技术的有益效果在于:获取历史实际光荷数据并进行缺值填补,对缺值填补后的历史实际光荷数据中的异常数据进行检测处理;基于kmeans++对检测后的历史实际光荷数据进行初步聚类并计算聚类指标,使用堆栈编码器对历史实际光荷数据进行降维重构,提取降维得到的空间的数据特征并计算重构损失,从而提高低维空间的特征表达性;使用kmeans++对数据特征进行聚类得到初始聚类中心以及聚类损失,从而根据重构损失和聚类损失建立损失函数并更新聚类结果;使用均值法计算聚类结果中各聚类场景的聚类中心,即得到典型光荷场景。因此,将特征提取过程与聚类过程相结合,能够保障低维嵌入空间特征的代表性,提高计算速度的同时也提高了聚类性能。
附图说明
[0016]图1为本专利技术实施例的一种基于kmeans++的深度嵌入聚类光荷场景生成方法的流程图;
[0017]图2为本专利技术实施例的生成光荷联合场景流程图;
[0018]图3为本专利技术实施例的基于IDEC
‑
K的光荷场景生成方法的网络结构图。
具体实施方式
[0019]为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图予以说明。
[0020]请参照图1,本专利技术实施例提供了一种基于kmeans++的深度嵌入聚类光荷场景生成方法,包括步骤:
[0021]获取历史实际光荷数据并进行缺值填补,对缺值填补后的所述历史实际光荷数据中的异常数据进行检测处理;
[0022]基于kmeans++对检测后的历史实际光荷数据进行初步聚类并计算聚类指标,使用手肘法得到最佳聚类簇数;
[0023]使用堆栈编码器对所述历史实际光荷数据进行降维重构,提取降维得到的空间的数据特征并计算重构损失;
[0024]基于kmeans++对所述数据特征进行聚类,得到初始聚类中心及其聚类损失,根据所述重构损失和聚类损失建立损失函数,使用所述损失函数更新聚类结果;
[0025]使用均值法计算所述聚类结果中各聚类场景的聚类中心,将所述各聚类场景的聚类中心作为光荷场景。
[0026]从上述描述可知,本专利技术的有益效果在于:获取历史实际光荷数据并进行缺值填补,对缺值填补后的历史实际光荷数据中的异常数据进行检测处理;基于kmeans++对检测后的历史实际光荷数据进行初步聚类并计算聚类指标,使用堆栈编码器对历史实际光荷数据进行降维重构,提取降维得到的空间的数据特征并计算重构损失,从而提高低维空间的特征表达性;使用kmeans++对数据特征进行聚类得到初始聚类中心以及聚类损失,从而根据重构损失和聚类损失建立损失函数并更新聚类结果;使用均值法计算聚类结果中各聚类场景的聚类中心,即得到典型光荷场景。因此,将特征提取过程与聚类过程相结合,能够保障低维嵌入空间特征的代表性,提高计算速度的同时也提高了聚类性能。
[0027]进一步地,所述获取历史实际光荷数据并进行缺值填补包括:
[0028]获取历史实际光荷数据,计算所述历史实际光荷数据的平均值,并使用所述平均值对所述历史实际光荷数据进行缺值填补。
[0029]由上述描述可知,当数据完全缺失时,可以选用平均值进行缺值填补。
[0030]进一步地,所述获取历史实际光荷数据并进行缺值填补还包括:
[0031]获取历史实际光荷数据,使用同一时间段内的数据对所述历史实际光荷数据进行缺值填补。
[0032]由上述描述可知,当数据随机缺失时,可以选用同一时间段内的数据进行缺值填补。
[0033]进一步地,所述对缺值填补后的所述历史实际光荷数据中的异常数据进行检测处理包括:
[0034]使用改进拉依达准则对缺值填补后的所述历史实际光荷数据进行异常值检测和处理,并对检测后的所述历史实际光荷数据进行归一化。
[0035]由上述描述可知,使用改进拉依达准则能够准确合理地筛选出异常值和亚异常值,提高异常检测精度。
[0036]进一步地,所述基于kmeans++对检测后的历史实际光荷数据进行初步聚类包括:
[0037]随机选择一个历史实际光荷数据作为第一初始聚类中心;
[0038]分别计算其余历史实际光荷数据与当前聚类中心的最短距离,并计算得到其余历史实际光荷数据被选为下一个聚类中心的概率,将最大概率对本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于kmeans++的深度嵌入聚类光荷场景生成方法,其特征在于,包括步骤:获取历史实际光荷数据并进行缺值填补,对缺值填补后的所述历史实际光荷数据中的异常数据进行检测处理;基于kmeans++对检测后的历史实际光荷数据进行初步聚类并计算聚类指标,使用手肘法得到最佳聚类簇数;使用堆栈编码器对所述历史实际光荷数据进行降维重构,提取降维得到的空间的数据特征并计算重构损失;基于kmeans++对所述数据特征进行聚类,得到初始聚类中心及其聚类损失,根据所述重构损失和聚类损失建立损失函数,使用所述损失函数更新聚类结果;使用均值法计算所述聚类结果中各聚类场景的聚类中心,将所述各聚类场景的聚类中心作为光荷场景。2.根据权利要求1所述的一种基于kmeans++的深度嵌入聚类光荷场景生成方法,其特征在于,所述获取历史实际光荷数据并进行缺值填补包括:获取历史实际光荷数据,计算所述历史实际光荷数据的平均值,并使用所述平均值对所述历史实际光荷数据进行缺值填补。3.根据权利要求2所述的一种基于kmeans++的深度嵌入聚类光荷场景生成方法,其特征在于,所述获取历史实际光荷数据并进行缺值填补还包括:获取历史实际光荷数据,使用同一时间段内的数据对所述历史实际光荷数据进行缺值填补。4.根据权利要求1所述的一种基于kmeans++的深度嵌入聚类光荷场景生成方法,其特征在于,所述对缺值填补后的所述历史实际光荷数据中的异常数据进行检测处理包括:使用改进拉依达准则对缺值填补后的所述历史实际光荷数据进行异常值检测和处理,并对检测后的所述历史实际光荷数据进行归一化。5.根据权利要求1所述的一种基于kmeans++的深度嵌入聚类光荷场景生成方法,其特征在于,所述基于kmeans++对检测后的历史实际光荷数据进行初步聚类包括:随机选择一个历史实际光荷数据作为第一初始聚类中心;分别计算其余历史实际光荷数据与当前聚类中心的最短距离,并计算得到其余历史实际光荷数据被选为下一个聚类中心的概率,将最大概率对应的历史实际光荷数据作为下一个聚类中心;重复所述分别计算其余历史实际光荷数据与当前聚类中心的最短距离的步骤,直至选出预设个数的聚类中心;根据预设个数的聚类中心进行数据对象的划分,得到预设个数的数据集;计算每个数据集的均值,将计算得到的均值作为新的聚类中心,并进行数据对象...
【专利技术属性】
技术研发人员:廖锦霖,吴桂联,张林垚,林婷婷,陈浩,倪识远,唐露,赖素丹,
申请(专利权)人:国网福建省电力有限公司经济技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。