基于有监督和无监督算法结合的负荷曲线数据可视化方法技术

技术编号:22295461 阅读:23 留言:0更新日期:2019-10-15 04:37
本发明专利技术涉及一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,首先,基于距离与曲线形态的双尺度相似性度量,采用无监督优化谱聚类算法获得负荷曲线精准标签数据;其次,采用稀疏自动编码器神经网络学习大规模待分类负荷曲线的内在特征,得到隐藏层权值矩阵即神经网络的优化初始参数;最后,基于已获得的标签数据,训练支持向量机神经网络分类器,实现对大规模待分类负荷曲线的有监督分类。有监督与无监督算法结合能够获得更精确的负荷曲线类别标签数据并一定程度上改进大数据导致的计算效率较低问题。

Visualization Method of Load Curve Data Based on Supervised and Unsupervised Algorithms

【技术实现步骤摘要】
基于有监督和无监督算法结合的负荷曲线数据可视化方法
本专利技术涉及智能电网用户侧负荷数据处理方法,尤其是涉及一种基于有监督和无监督算法结合的负荷曲线数据可视化方法。
技术介绍
随着电网用户侧对电能使用多方面要求的提升,社会逐渐暴露出资源短缺等问题。为应对能源短缺问题,国家在接入高比例可再生能源的同时,进一步开放售电市场,使得用户在用电选择上具有更多的自由性。由此带来的用户端的高自由度导致负荷曲线更加趋于多样化。用户用电行为在季节、时段等方面存在一定的潜在规律。采用聚类或分类技术对负荷曲线进行分析,是详细了解用户用电特征的重要手段。电力负荷曲线分类是需求侧管理、负荷建模等工作的重要基础,对电力系统的分析、运行、规划都具有重要意义。电力负荷曲线分类方法主要有无监督、有监督,以及无监督和有监督结合等方法。负荷曲线无监督分类主要采用基于划分的k-means和模糊C均值聚类、层次聚类、自组织映射聚类等方法。面对当今智能电网大数据场景下电力负荷曲线数量繁多、形态差异显著等问题,较广泛应用的划分式聚类算法仅以单一的传统距离量度方式判断负荷曲线相似度难以有效区分形态差异较大的负荷曲线。负荷数据维数越高,平均距离这一测度的意义就越小。因此,考虑引入皮尔逊相关系数代替欧氏距离判据改善负荷形态聚类效果,但仅能识别出幅度不同形态相似的负荷曲线。还有学者提出一种以余弦相似度作为外层聚类判据,欧式距离作为内层聚类判据的双层聚类分析方法,一定程度上可以有效识别出负荷类型。但是,现有文献大多仅针对距离的相似性度量函数进行优化,并未综合考虑负荷曲线形态特征相似度,因此导致聚类效果并不理想。负荷曲线有监督分类主要采用基于统计原理的最小距离分类、贝叶斯分类,以及基于人工神经网络的分类等方法。其中,人工神经网络因为其自主学习能力强,容错性能良好等特点应用更为广泛。采用Kohonen神经网络对负荷动态特性进行聚类,验证该神经网络应用于负荷分类的优越性;采用BP神经网络学习负荷动态特性,但BP神经网络的解受训练样本影响较大,这个不足限制了BP神经网络的广泛应用。神经网络的在目前的研究中还存在着训练样本过大导致分类效率低下、训练过程中出现过拟合等问题。鉴于无监督和有监督分类方法存在的问题,近年来有学者提出采用无监督与有监督相结合的负荷曲线分类方法。利用无监督算法获取标签数据,作为有监督分类算法的训练样本。将无监督算法的复杂度低、适用性强与有监督算法的效率高、描述复杂动态行为效果好等优势相结合。将模糊C均值聚类或k-means聚类与神经网络相结合,一定程度上能够提高海量数据处理效率。但是,现有文献在获取标签数据环节一般仅考虑距离相似度判据,获得的标签数据精准较低,对最终的分类结果会造成一定的影响。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于有监督和无监督算法结合的负荷曲线数据可视化方法。本专利技术的目的可以通过以下技术方案来实现:一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,该方法包括以下步骤:步骤1:针对输入的用户用电负荷曲线数据通过误差平方和(sumofsquarederror,SSE)确定最优聚类数;步骤2:选取输入的用户用电负荷曲线数据中的部分数据通过无监督双尺度谱聚类对其进行聚类,获得类别标签数据;步骤3:通过稀疏自编码算法学习输入的用户用电负荷曲线数据的内在特征并初始化神经网络分类器;步骤4:利用步骤2中的类别标签数据训练步骤3中的神经网络分类器,获取训练完成的神经网络分类器;步骤5:将步骤1中的输入的用户用电负荷曲线数据通过训练完成的神经网络分类器进行有监督数据分类,获得经过有监督数据分类的用户用电负荷曲线数据;步骤6:将经过有监督数据分类的用户用电负荷曲线数据传输至用于电力调配的可视化设备上并显示。进一步地,所述步骤2包括以下分步骤:步骤21:根据欧式距离公式判断输入的用户用电负荷曲线数据中的部分数据的距离相似度并建立距离相似性度量矩阵;步骤22:根据相关性系数公式判断输入的用户用电负荷曲线数据中的部分数据的形态相似度并建立形态相似性度量矩阵;步骤23:根据距离相似性度量矩阵和形态相似性度量矩阵建立双尺度相似性度量矩阵并对其进行谱聚类,获得类别标签数据。进一步地,所述步骤21中的欧式距离公式为:式中,ai,j表示彼此i和j两条用户用电负荷曲线数据之间的欧式距离,m表示维数,k、i和j均为自然数,xi,k和xj,k分别表示彼此i和j两条用户用电负荷曲线数据中对应第k点的数据值。进一步地,所述步骤22中的相关性系数公式为:式中,bij表示彼此i和j两条用户用电负荷曲线数据之间的相关距离,表示第i条用户用电负荷曲线数据平均值,表示第j条用户用电负荷曲线数据平均值。进一步地,所述步骤23中的双尺度相似性度量矩阵为:P=αA+βB,α+β=1式中,P表示双尺度相似性度量矩阵,A表示距离相似性度量矩阵,B表示形态相似性度量矩阵,α和β分别为距离相似性度量矩阵和形态相似性度量矩阵的权重参数。进一步地,所述步骤4包括以下分步骤:步骤41:设置神经网络分类器的初步参数,所述初步参数包括训练学习率,稀疏参数、随机权值矩阵和随机偏移矩阵;步骤42:设置神经网络分类器前向算法中的训练次数、迭代次数,并进一步得出神经网络分类器隐藏层神经元的平均激活量;步骤43:对神经网络分类器输出层的每一个神经元经过稀疏代价函数处理后反向传播更新层间连接权值,至此神经网络分类器设置完毕;步骤44:利用类别标签数据中的无标签用户负荷数据输入对设置完毕的神经网络分类器进行训练,同时执行前向算法并使用梯度下降算法微调网络参数以提升训练精度,最终获得训练完成的神经网络分类器。进一步地,所述步骤42中的神经网络分类器隐藏层神经元的平均激活量为:式中,ρj表示神经网络分类器隐藏层神经元的平均激活量,n表示神经元数量,aj(l)()表示第l层第i个神经元的激活值,x表示输入负荷曲线数据矩阵,l为自然数。进一步地,所述步骤6中的可视化设备包括显示器、投影仪和电力监控仪。与现有技术相比,本专利技术具有以下优点:(1)本专利技术采用基于距离和曲线形态双尺度相似性度量的优化谱聚类算法,获得更精确的负荷曲线类别标签数据,引入稀疏自动编码器优化神经网络分类器实现更好效果的负荷曲线分类,数据处理精确度更高。(2)本专利技术中双尺度相似性度量能够克服仅根据距离判断曲线相似性带来的局限,同时分析曲线波动特征从而保证数据聚类的准确性与有效性,提高标签数据的精度,对SAE自编码算法内部参数进行优化,进一步提高神经网络对负荷数据的适应度。使用数据内在特征矩阵初始化SVM支持向量机神经网络训练,使分类器经训练后具有较强的分类能力,SAE自编码算法与SVM支持向量机神经网络结合在数据分类适确性、轮廓系数以及有效性等指标上表现更佳,对于用户负荷曲线分类更加有效,计算效率一定程度上得到提升。附图说明图1为本专利技术的方法流程示意图;图2为本专利技术方法的用户负荷数据特征学习与分类网络结构图;图3为本专利技术方法确定稀疏自动编码器参数中神经元数量对聚类效果的影响效果图;图4为本专利技术方法确定稀疏自动编码器参数中稀疏参数对聚类效果的影响效果图;图5为本专利技术方法确定聚类数的误差平方和SSE曲线图;图6为本方本文档来自技高网
...

【技术保护点】
1.一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,该方法包括以下步骤:步骤1:针对输入的用户用电负荷曲线数据通过误差平方和确定最优聚类数;步骤2:选取输入的用户用电负荷曲线数据中的部分数据通过无监督双尺度谱聚类对其进行聚类,获得类别标签数据;步骤3:通过稀疏自编码算法学习输入的用户用电负荷曲线数据的内在特征并初始化神经网络分类器;步骤4:利用步骤2中的类别标签数据训练步骤3中的神经网络分类器,获取训练完成的神经网络分类器;步骤5:将步骤1中的输入的用户用电负荷曲线数据通过训练完成的神经网络分类器进行有监督数据分类,获得经过有监督数据分类的用户用电负荷曲线数据;步骤6:将经过有监督数据分类的用户用电负荷曲线数据传输至用于电力调配的可视化设备上并显示。

【技术特征摘要】
1.一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,该方法包括以下步骤:步骤1:针对输入的用户用电负荷曲线数据通过误差平方和确定最优聚类数;步骤2:选取输入的用户用电负荷曲线数据中的部分数据通过无监督双尺度谱聚类对其进行聚类,获得类别标签数据;步骤3:通过稀疏自编码算法学习输入的用户用电负荷曲线数据的内在特征并初始化神经网络分类器;步骤4:利用步骤2中的类别标签数据训练步骤3中的神经网络分类器,获取训练完成的神经网络分类器;步骤5:将步骤1中的输入的用户用电负荷曲线数据通过训练完成的神经网络分类器进行有监督数据分类,获得经过有监督数据分类的用户用电负荷曲线数据;步骤6:将经过有监督数据分类的用户用电负荷曲线数据传输至用于电力调配的可视化设备上并显示。2.根据权利要求1所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤2包括以下分步骤:步骤21:根据欧式距离公式判断输入的用户用电负荷曲线数据中的部分数据的距离相似度并建立距离相似性度量矩阵;步骤22:根据相关性系数公式判断输入的用户用电负荷曲线数据中的部分数据的形态相似度并建立形态相似性度量矩阵;步骤23:根据距离相似性度量矩阵和形态相似性度量矩阵建立双尺度相似性度量矩阵并对其进行谱聚类,获得类别标签数据。3.根据权利要求2所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤21中的欧式距离公式为:式中,ai,j表示彼此i和j两条用户用电负荷曲线数据之间的欧式距离,m表示维数,k、i和j均为自然数,xi,k和xj,k分别表示彼此i和j两条用户用电负荷曲线数据中对应第k点的数据值。4.根据权利要求2所述的一种基于有监督和无监督算法结合的负荷曲线数据可视化方法,其特征在于,所述步骤22中的相关性系数公...

【专利技术属性】
技术研发人员:林顺富顾乡刘持涛颜昕昱
申请(专利权)人:上海电力学院
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1