System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法技术_技高网

一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法技术

技术编号:40820974 阅读:7 留言:0更新日期:2024-04-01 14:40
本发明专利技术公开了一种基于改进K‑means聚类算法的多场景光伏用户用电行为分析方法,包括以下步骤:获取历史数据,对历史数据进行预处理;根据预处理后的数据采用粒子群算法对K‑means聚类算法进行初步优化;采用初步优化后的K‑means聚类算法进行聚类分析获得初步集群聚类结果;利用KPCA方法提取初步集群的特征;采用DTW方法对提取的特征进行相似性分析,建立累计距离最小值矩阵;基于累计距离最小矩阵对初步优化后的K‑means聚类算法进行二次优化;根据二次优化后的K‑means聚类算法获得最终集群聚类结果,基于最终集群聚类结果对光伏用户用电行为进行分析;本发明专利技术能够充分挖掘光伏用户负荷样本数据曲线纵向和横向变化趋势,用户用电行为分析结果更加准确。

【技术实现步骤摘要】

本专利技术涉及新能源,尤其涉及一种基于改进k-means聚类算法的多场景光伏用户用电行为分析方法。


技术介绍

1、低压分布式光伏用户用电行为复杂多变,用户负荷特性多种多样。目前对用户用电模式分析没有统一的标准体系,各种不同类型用户的用电偏好、业务构架错综复杂,因而归纳用户喜好类别和确切需求存在难度,难以根据用户特征和喜好进行精准推送数据和互动服务。低压分布式光伏互动服务建设方面,光伏用户用电行为分析的技术路线也有待探索。为了加强电网与电力用户的双向互动,提高公众的参与意识,实现智能化的能源管理,有必要对用户的用电行为模式进行分析和研究。

2、用户行为分析时常用的方法是对负荷曲线进行模式提取,负荷曲线的聚类是一种较为常用的电力大数据挖掘方法。但聚类的初始簇中心会严重影响聚类质量,为了提高聚类的精准度常用的方法是优化初始簇中心,然后再执行聚类运算。对于大量的光伏用户输入样本,其中极有可能存在冗余信息,无法较好的反映光伏波动特性。同时,由于天气复杂多变,同一类光伏用户中各类光伏波动特性也不相同。而传统k-means算法由于受聚类簇数k选择的影响,当使用不合适的k值时,通常聚类结果存在不稳定性。

3、例如,中国专利cn202210286512.3公开了一种基于k-means和支持向量回归的电力用户分类方法、装置及系统,该方法包括获取历史负荷数据;选用k-means方法对所述历史负荷数据进行聚类,其中,聚类类别数通过轮廓系数法确定,聚类中心通过层次聚类法确定;利用聚类结果训练获得支持向量回归模型;将获得的实时负荷数据输入至所述支持向量回归模型,获得电力用户分类;该方法减少聚类所用的时间和复杂度;然而该方法的聚类结果依然存在稳定性以及准确性差的问题。


技术实现思路

1、本专利技术主要解决现有的技术中对光伏用户的用电特性分析结果准确性差的问题;提供一种基于改进k-means聚类算法的多场景光伏用户用电行为分析方法,利用经改进粒子群算法优化过的k-means算法进行特征值聚类,对光伏用户的用电行为特性分析结果准确度高、稳定性好。

2、本专利技术的上述技术问题主要是通过下述技术方案得以解决的:一种基于改进k-means聚类算法的多场景光伏用户用电行为分析方法,包括以下步骤:

3、获取历史数据,对历史数据进行预处理;

4、根据预处理后的数据采用粒子群算法对k-means聚类算法进行初步优化;

5、采用初步优化后的k-means聚类算法进行聚类分析获得初步集群聚类结果;

6、利用kpca方法提取初步集群的特征;

7、采用dtw方法对提取的特征进行相似性分析,建立累计距离最小值矩阵;

8、基于累计距离最小矩阵对初步优化后的k-means聚类算法进行二次优化;

9、根据二次优化后的k-means聚类算法获得最终集群聚类结果,基于最终集群聚类结果对光伏用户用电行为进行分析。

10、作为优选,所述的对历史数据进行预处理的方法为:基于正态分布对异常数据进行筛选;对缺失数据进行填补;对数据进行降噪处理;对数据进行标准化处理。

11、作为优选,对k-means聚类算法进行初步优化的方法为:

12、用k个表示聚类中心的元素组成各粒子的位置,作为初始粒子;

13、对每个粒子,比较它的个体适应度pid,如果更好则更新pid;

14、每个粒子,比较它的全局适应度pgd,如果更好则更新pgd;

15、调整各粒子的位置和速度;

16、按照最邻近法则对于新一代粒子重新确定聚类划分,并计算更新聚类中心,更新粒子的适应度,重新编码粒子;

17、如果达到结束条件则结束,否则继续比较粒子的个体适应度。

18、作为优选,所述聚类分析采用簇内平方和与簇间距离比以及调整戴维斯波尔丁指数作为聚类效果的内部评价指标。

19、作为优选,所述的簇内平方和与簇间距离比的计算方法为:

20、

21、其中dbi表示戴维斯波尔丁指数;

22、k为聚类个数;

23、表示该簇的聚类中心与簇内各元素之间的欧式距离;

24、表示各簇聚类中心之间的欧氏距离。

25、作为优选,所述的戴维斯波尔丁指数的计算方法为:

26、

27、其中k为聚类个数;d(ci,cj)表示第i簇与第j簇聚类中心间的综合距离;di表示第i簇类内平均误差;dj表示第j簇类内平均误差。

28、作为优选,kpca方法提取初步集群的特征的方法为:

29、对输入的初步集群数据的高维特征进行非线性降维;

30、对特征向量进行标准化处理后得到对应特征值;

31、根据特征值计算主元贡献率和累计贡献率;

32、记录主元所在特征向量中的个数作为提取的特征数据。

33、作为优选,建立累计距离最小值矩阵的过程中计算累计距离的最小值的约束条件包括边界线约束、连续性约束以及单调性约束。

34、作为优选,对缺失数据进行填补包括采用均值填补或中位数填补。

35、作为优选,所述的历史数据包括光伏发电数据、用户负荷数据以及气象数据。

36、本专利技术的有益效果是:通过粒子群算法对k-means聚类算法进行优化精确选取了k-means聚类数k,使得在用户用电行为分析聚类时取得很好的效果;利用经改进粒子群算法优化过的k-means聚类算法进行特征值聚类,改善k-means算法对初值的敏感性;基于kpca-dtw的光伏用户负荷非线性特征评估,对光伏用户负荷数据进行非线性主成分分析,能够较好剔除原数据样本中的无用特征与离群点;基于提取特征使用dtw对样本进行相似性分析,能够充分挖掘光伏用户负荷样本数据曲线纵向和横向变化趋势,提高了光伏用户聚类样本之间的相似度,用户用电行为分析结果更加准确。

本文档来自技高网...

【技术保护点】

1.一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

3.根据权利要求1所述的一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

4.根据权利要求1或2或3所述的一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

5.根据权利要求4所述的一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

6.根据权利要求4所述的一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

7.根据权利要求1所述的一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

8.根据权利要求1所述的一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

9.根据权利要求2所述的一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

10.根据权利要求1所述的一种基于改进K-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

...

【技术特征摘要】

1.一种基于改进k-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于改进k-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

3.根据权利要求1所述的一种基于改进k-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

4.根据权利要求1或2或3所述的一种基于改进k-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

5.根据权利要求4所述的一种基于改进k-means聚类算法的多场景光伏用户用电行为分析方法,其特征在于,

...

【专利技术属性】
技术研发人员:韩蕾林英鹤郑宇峰闻安焦田利董伟季德伟侯艳琼唐小淇俞敏潘一洲
申请(专利权)人:浙江华云信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1