当前位置: 首页 > 专利查询>三峡大学专利>正文

一种考虑综合相似性度量的光伏典型出力场景聚类方法技术

技术编号:39320063 阅读:13 留言:0更新日期:2023-11-12 16:01
本发明专利技术提供了一种考虑综合相似性度量的光伏典型出力场景聚类方法,首先考虑光伏发电特性,以光伏出力曲线的电量大小相似性、形态趋势相似性和波动位置相似性综合度量曲线的距离;然后构建光伏场景集聚类消减模型,以相异性矩阵选取初始中心点、以综合度量距离作为样本划分依据,以两阶段质心优化法提取典型场景,以有效性评价指标确定最优聚类数目,分别对传统K

【技术实现步骤摘要】
一种考虑综合相似性度量的光伏典型出力场景聚类方法


[0001]本专利技术属于光伏出力场景缩减
,特别是涉及一种考虑综合相似性度量的光伏典型出力场景聚类方法。

技术介绍

[0002]截至2022年底,我国光伏累计装机容量约达3.92亿千瓦,居世界第一位。随着光伏规模逐年快速递增,光伏发电数据呈现出海量、高维和随机性强的特点,为了研究光伏等可再生能源渗透背景下电力系统规划、运行、调度等优化问题,需要对光伏出力场景进行有效缩减,用最少数据量反映最真实的光伏发电特性,以达到减少计算量的目的,因此,如何从大规模数据中准确高效地构建出出力典型场景是亟待解决的理论与实践难题。
[0003]聚类作为一种无监督机器学习方法,在电力系统负荷分类,风、光新能源特征场景提取等方面应用较多,传统聚类算法是通过合适相似性度量方法将场景划分为不同类别,再提取同类别中典型场景,但在应用时仍然存在几方面问题:

曲线相似性度量问题,相似性度量是时间序列无监督聚类以及其他时间序列分析的基础,目前主要采用单一度量距离或多种度量距离结合判断曲线相似性,如经典欧式距离、Wasserstein概率距离、动态时间弯曲距离、相关系数距离、欧式距离+形态距离等,这些方法虽然能够从整体数值或总体形态上度量曲线间的相似性,但对由天气状态变化造成的光伏发电曲线间的波动时移差异性较少考虑。

典型质心提取问题,质心作为聚类簇中的代表曲线,需反映簇的整体特性以及簇间的差异性,其中算术平均法、中位数法、模糊质心法、概率密度法等方法应用较多,但这些方法易受离群点和噪声影响,可能会降低聚类结果的准确性。有学者将质心提取作为优化问题求解,在一定程度上提高了质心的质量,但大多是以单个目标进行优化,较少考虑质心的多维代表性,如数值、形态等。

典型场景集质量评价问题,现有研究大多采用聚类有效性指标如SSE指数、DBI指数、CHI指数等,分别从类间分散性和类内紧凑性来评价聚类结果好坏,这些指标大多是以欧式距离度量样本间的相似性,也有学者利用不同距离函数对有效性指标改进来评价聚类结果,虽然可以有效解决因度量方式不同造成的结果评价误差,但还是可能无法较好的对采用不同度量方式的算法统一评价,而目前较少有人根据研究对象特性不同建立不同综合指标体系对不同算法生成的场景集同时进行评价。

技术实现思路

[0004]本专利技术的目的在于在现有聚类方法的基础上,提供了一种考虑综合相似性度量的光伏典型出力场景聚类方法,解决了上述
技术介绍
中提出的问题。
[0005]为实现以上目的,本专利技术通过以下技术方案予以实现:一种考虑综合相似性度量的光伏典型出力场景聚类方法,包含以下步骤:
[0006]步骤1,光伏曲线综合相似性度量:
[0007]考虑光伏发电特性,以光伏出力曲线的电量大小相似性、形态趋势相似性和波动位置相似性综合度量曲线的距离;
[0008]步骤2,构建光伏场景集聚类消减模型:
[0009]以相异性矩阵选取初始中心点、以综合度量距离作为样本划分依据,以两阶段质心优化法提取典型场景,以有效性评价指标确定最优聚类数目,分别对传统K

means算法加以改进;
[0010]步骤3,典型场景集验证:
[0011]选取平均波动次数、平均波动幅度、出力分布偏度、出力分布峰度、极端波动率和电量这6个指标通过熵权Topsis法对典型场景集结果综合评价。
[0012]所述步骤1中光伏曲线综合相似性度量的详细步骤为:
[0013]假设两条光伏出力曲线为x=(x1,x2,

,x
m
)和y=(y1,y2,

y
m
),其中,m表示曲线采样点总数;x1,x2,

,x
m
表示曲线x在1,2,...,m时刻的出力,单位为:MW;y1,y2,

,y
m
表示曲线y在1,2,...,m时刻的出力,单位为:MW;
[0014]步骤1.1,以出力曲线x和y与坐标轴围成面积差值作为两者电量大小相似性,电量大小相似性距离公式表达如下:
[0015][0016]式中,ΔE(x,y)表示曲线x和y的电量大小相似性距离;t表示第t个采样点;m表示曲线采样点总数;x
t
和y
t
分别表示第t个采样点曲线x和y的出力,单位为:MW;表示曲线x和y电量差值的绝对值;表示曲线x和y两者电量较大值,ΔE(x,y)值越小表示两者电量越相似;
[0017]步骤1.2,为保证曲线缩放不变性,选择Z

Score标准化方法对两条曲线标准化以降低出力幅值变化对相关性分析造成的影响;
[0018]步骤1.3,计算两条曲线互相关时固定一条曲线不动,沿横坐标轴以步长为1从初始位置滑动y到与x对齐的位置,在曲线y没有对齐曲线x的位置用0替换y曲线原位置的数据,由此可得曲线x和y的互相关序列函数表达如下:
[0019][0020][0021]式中,表示曲线x和y的互相关序列,其中,表示取时曲线x和y的互相关值;表示移动步长为s时序列的长度,s表示曲线y沿横坐标轴移动步长,s∈[

m,m];m表示曲线采样点总数;R
s
(x,y)表示曲线y沿横坐标轴每移动一次时两条曲线的点积之和;h表示曲线y和x对齐的位置下标,通过互相关序列可以得到最大互相关值对应的位置再根据可以
得到此时曲线y的位移以及曲线y的最优位移曲线;
[0022]步骤1.4,为保证曲线位移不变性,采用系数归一化方法对互相关序列进行处理,使零滞后自相关系数等于1,系数归一化公式如下:
[0023][0024]式中,NCC
c
(x,y)表示曲线x和y系数归一化后的互相关序列,NCC
c
(x,y)序列中数据取值范围为[

1,1];表示曲线x和y的互相关序列;表示移动步长为s时序列的长度;s表示曲线y沿横坐标轴移动步长,s∈[

m,m];R0(x,x)表示曲线x的自相关值;R0(y,y)表示曲线y的自相关值;当NCC
c
(x,y)序列中数据为1、

1时,表示此时两条曲线形态正、负相关,为方便计算,定义曲线x和y的形态趋势相似性距离如下:
[0025]SBD(x,y)=1

max(NCC
c
(x,y))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0026]式中,SBD(x,y)表示曲线x和y的形态趋势相似性距离,其范围为[0,2];max(NCC
c
(x,y))表示曲线x和y系数归一化后的互相关序列中的最大值,SBD(x,y)值越小表示曲线x和y形态趋势越相似;
[0027]步骤1.5本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种考虑综合相似性度量的光伏典型出力场景聚类方法,其特征在于:首先考虑光伏发电特性,以光伏出力曲线的电量大小相似性、形态趋势相似性和波动位置相似性综合度量曲线的距离;然后构建光伏场景集聚类消减模型,以相异性矩阵选取初始中心点、以综合度量距离作为样本划分依据,以两阶段质心优化法提取典型场景,以有效性评价指标确定最优聚类数目,分别对传统K

means算法加以改进;最后选取平均波动次数、平均波动幅度、出力分布偏度、出力分布峰度、极端波动率和电量这6个指标通过熵权Topsis法对典型场景集结果综合评价。2.根据权利要求1所述的一种考虑综合相似性度量的光伏典型出力场景聚类方法,其特征在于,具体操作步骤如下:步骤1,光伏曲线综合相似性度量:考虑光伏发电特性,以光伏出力曲线的电量大小相似性、形态趋势相似性和波动位置相似性综合度量曲线的距离;步骤2,构建光伏场景集聚类消减模型:以相异性矩阵选取初始中心点、以综合度量距离作为样本划分依据,以两阶段质心优化法提取典型场景,以有效性评价指标确定最优聚类数目,分别对传统K

means算法加以改进;步骤3,典型场景集验证:选取平均波动次数、平均波动幅度、出力分布偏度、出力分布峰度、极端波动率和电量这6个指标通过熵权Topsis法对典型场景集结果综合评价。3.根据权利要求2所述的一种考虑综合相似性度量的光伏典型出力场景聚类方法,其特征在于,所述步骤1中光伏曲线综合相似性度量的详细步骤为:假设两条光伏出力曲线为x=(x1,x2,

,x
m
)和y=(y1,y2,

y
m
),其中,m表示曲线采样点总数;x1,x2,

,x
m
表示曲线x在1,2,...,m时刻的出力,单位为:MW;y1,y2,

,y
m
表示曲线y在1,2,...,m时刻的出力,单位为:MW;步骤1.1,以出力曲线x和y与坐标轴围成面积差值作为两者电量大小相似性,电量大小相似性距离公式表达如下:式中,ΔE(x,y)表示曲线x和y的电量大小相似性距离;t表示第t个采样点;m表示曲线采样点总数;x
t
和y
t
分别表示第t个采样点曲线x和y的出力,单位为:MW;表示曲线x和y电量差值的绝对值;表示曲线x和y两者电量较大值,ΔE(x,y)值越小表示两者电量越相似;步骤1.2,为保证曲线缩放不变性,选择Z

Score标准化方法对两条曲线标准化以降低出力幅值变化对相关性分析造成的影响;步骤1.3,计算两条曲线互相关时固定一条曲线不动,沿横坐标轴以步长为1从初始位
置滑动y到与x对齐的位置,在曲线y没有对齐曲线x的位置用0替换y曲线原位置的数据,由此可得曲线x和y的互相关序列函数表达如下:此可得曲线x和y的互相关序列函数表达如下:式中,表示曲线x和y的互相关序列,其中,表示取时曲线x和y的互相关值;表示移动步长为s时序列的长度,s表示曲线y沿横坐标轴移动步长,s∈[

m,m];m表示曲线采样点总数;R
s
(x,y)表示曲线y沿横坐标轴每移动一次时两条曲线的点积之和;h表示曲线y和x对齐的位置下标,通过互相关序列可以得到最大互相关值对应的位置再根据可以得到此时曲线y的位移以及曲线y的最优位移曲线;步骤1.4,为保证曲线位移不变性,采用系数归一化方法对互相关序列进行处理,使零滞后自相关系数等于1,系数归一化公式如下:式中,NCC
c
(x,y)表示曲线x和y系数归一化后的互相关序列,NCC
c
(x,y)序列中数据取值范围为[

1,1];表示曲线x和y的互相关序列;表示移动步长为s时序列的长度;s表示曲线y沿横坐标轴移动步长,s∈[

m,m];R0(x,x)表示曲线x的自相关值;R0(y,y)表示曲线y的自相关值;当NCC
c
(x,y)序列中数据为1、

1时,表示此时两条曲线形态正、负相关,为方便计算,定义曲线x和y的形态趋势相似性距离如下:SBD(x,y)=1

max(NCC
c
(x,y))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)式中,SBD(x,y)表示曲线x和y的形态趋势相似性距离,其范围为[0,2];max(NCC
c
(x,y))表示曲线x和y系数归一化后的互相关序列中的最大值,SBD(x,y)值越小表示曲线x和y形态趋势越相似;步骤1.5,以两条曲线的波动出现位置偏差作为两条曲线的波动位置相似性,波动位置相似性距离公式表达如下:式中,δ(x,y)表示曲线x和y的波动位置相似性距离;表示曲线y滑动到和x形态趋势最相似时的位移绝对值;m表示曲线采样点总数,δ(x,y)值越小表示曲线x和y波动位置越相似;步骤1.6,为反映发电曲线间的综合相似性,在电量大小相似性基础上考虑形态趋势相似性和波动位置相似性,得到适用于光伏发电曲线的综合相似性度量距离,公式表达如下:ESD(x,y)=ΔE(x,y)
·
SBD(x,y)
·
δ(x,y)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(7)
式中,ESD(x,y)表示曲线x和y的综合相似性距离;ΔE(x,y)表示曲线x和y的电量大小相似性距离;SBD(x,y)表示曲线x和y的形态趋势相似性距离;δ(x,y)表示曲线x和y的波动位置相似性距离,综合相似性度量距离ESD(x,y)越小表示两条曲线越相似。4.根据权利要求2所述的一种考虑综合相似性度量的光伏典型出力场景聚类方法,其特征在于,所述步骤2中构建光伏场景集聚类消减模型的详细步骤为:步骤2.1,数据预处理:采用拉格朗日插值法对缺失的光伏出力数据补全,剔除偏差较大数据,完成数据的清洗;步骤2.2,初始化聚类参数:设置最大聚类数目、迭代次数、初始聚类数目;步骤2.3,确定初始聚类中心:在构建相异性矩阵的基础上定义均值相异性和总体相异性两种度量准则,根据此准则来确定初始聚类中心,相异性矩阵是一个对象结构,存放的是若干条曲线彼此之间形成的相异性,以综合相似性距离定义两条曲线间的相异性,假设若干条光伏出力曲线用矩阵X=[x1,x2,...,x
i
,...,x
n
]
T
表示,其中,x1,x2,...,x
i
,...,x
n
表示第1,2,...,i,...,n条曲线,表示第i条曲线在1,2,...,m时...

【专利技术属性】
技术研发人员:程雄戴鹏张太衡周彬彬
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1