一种风电机组功率曲线异常散点剔除方法及装置制造方法及图纸

技术编号:33643057 阅读:12 留言:0更新日期:2022-06-02 20:18
本发明专利技术公开了一种风电机组功率曲线异常散点剔除方法,包括以下步骤:步骤S1)获取目标机组的SCADA数据,所述SCADA数据包括状态码、风速和功率;步骤S2)按照状态码规则进行初步筛选,获得目标机组正常发电状态的风速、功率数据;步骤S3)基于DBSCAN聚类算法,获得风速

【技术实现步骤摘要】
一种风电机组功率曲线异常散点剔除方法及装置


[0001]本专利技术涉及风力发电
,具体涉及一种风电机组功率曲线异常散点剔除方法及装置。

技术介绍

[0002]风电机组的功率曲线,表征着机组发电性能运行优劣,是机组后续优化、控制、评估工作的关键输入数据。由于结冰、限电、状态码混乱、程序升级等原因,风电机组功率曲线可能存在异常散点,仅通过状态码规则无法完全剔除异常散点,当上述异常散点数据应用在机组性能优化、故障预警与诊断、考核评估时,会给模型带来一定误差。因此,在应用风电机组功率曲线数据时,需要考虑剔除异常散点数据,确保应用结果精确可靠。
[0003]目前,被广泛使用的风电机组功率曲线异常散点剔除方法主要是基于表征机组状态的状态码完成。具体的,通过状态码规则筛选得到机组正常发电状态下的风速、功率等数据。然而,机组实际运行时的风速、功率数据,受多种因素影响,状态码规则筛选后仍有离群的分布的散点。时下热门的异常散点剔除方法有基于密度的聚类算法,认为分布于功率曲线上的散点较密集,通过功率曲线散点的分布差异剔除异常散点。由于运行工况的影响,机组功率曲线散点分布并不均匀,当离群散点密集分布,和功率曲线上的散点难以分隔开时,使用聚类算法剔除异常散点的效果将大大下降。
[0004]综上所述,如何准确地完全剔除功率曲线异常散点,是目前风电领域技术人员需要解决的技术研究问题。

技术实现思路

[0005]针对现有技术存在的上述不足,本专利技术的目的在于提供一种风电机组功率曲线异常散点剔除方法及装置,可准确地将异常散点剔除,有利于功率曲线的准确计算及可靠应用。
[0006]为了实现上述目的,本专利技术采用以下技术方案:
[0007]一种风电机组功率曲线异常散点剔除方法,包括以下步骤:步骤S1)获取目标机组的SCADA数据,所述SCADA数据包括状态码、风速和功率;步骤S2)按照状态码规则进行初步筛选,获得目标机组正常发电状态的风速、功率数据;步骤S3)基于DBSCAN聚类算法,获得风速

功率散点的主簇;步骤S4)将满足条件的数据归入主簇,确定主簇为正常数据,剔除其他簇数据;步骤S5)基于RANSAC回归模型,拟合功率曲线;步骤S6)设置功率曲线的散点边界,剔除异常散点。本专利技术提供一种风电机组功率曲线异常散点剔除方法,具体过程为:获取目标机组的状态码数据,利用状态码规则初步剔除机组功率曲线异常数据;根据DBSCAN聚类模型,筛选出功率曲线主簇;根据额定风速和额定功率,将额定风速以上达到一定功率的数据归到主簇,剔除其他簇数据,形成新的正常数据集;根据训练好的RANSAC回归模型,拟合功率曲线,设置功率曲线散点边界,剔除异常散点,得到机组功率曲线的正常散点数据。其中,训练RANSAC回归模型的过程,包括获取学习样本,学习样本基于功率分层法提取;设置
功率曲线散点边界的过程,包括获取各功率段的风速宽度,根据平均风速宽度设置边界阈值。
[0008]由于结冰、限电、状态码混乱、程序升级等原因,风电机组功率曲线存在异常散点,仅通过状态码规则无法完全剔除异常散点。利用基于密度的DBSCAN聚类算法,可以剔除分布较散的功率曲线异常散点,但对于分布较密集的功率曲线异常散点,仍然难以剔除,聚类算法存在一定不足。利用RANSAC回归模型对额定功率前的功率曲线散点拟合成曲线,结合各功率段的风速宽度,设置功率曲线散点边界阈值,可以剔除分布较密集的功率曲线异常散点。在现有技术的基础上,本专利技术先利用状态码规则进行初步筛选,然后基于DBSCAN聚类算法剔除分布较散的异常散点,再利用RANSAC回归模型拟合功率曲线,剔除分布较密集的异常散点,本方法可以使拟合的功率曲线更精准,使功率曲线具备合理、光滑的形态,有利于后续功率曲线的准确计算及可靠应用。
[0009]作为优选,步骤S3的具体过程,包括以下步骤:步骤S301:设风速

功率散点集合为{(v1,p1),(v2,p2),

,(v
n
,p
n
)};步骤S302:对风速

功率散点集合{(v1,p1),(v2,p2),

,(v
n
,p
n
)}进行归一化处理,得到归一化后的风速

功率散点集合步骤S303:将归一化后的风速

功率散点集合输入至DBSCAN聚类模型,获得风速

功率散点的主簇。
[0010]作为优选,步骤S4中所述条件为:风速

功率散点(v
i
,p
i
)中v
i
≥v
额定
且p
i
≥p
额定
*0.95。
[0011]作为优选,步骤S5的具体过程,包括以下步骤:步骤S501:采用功率分层法获取风速

功率学习样本,所述学习样本的风速

功率散点中功率低于额定功率;步骤S502:基于学习样本,训练RANSAC回归模型,以实际功率p
i
为输入,预测对应的风速v_pr
i

[0012]作为优选,步骤S501的具体过程,包括以下步骤:步骤S5011:基于T个功率区间{(0,δ),(δ,2δ),

,((T

1)*δ,p
额定
)},δ表示设置的单位功率长度,将风速

功率散点划分到T个数据集{dataset 1,dataset 2,

,dataset T}中,统计全部数据集的功率四分位点的样本数num
f
;步骤S5012:计算各数据集的风速宽度d
i
,根据设置的风速宽度阈值∈,获取初始学习样本,具体为:当v
i
≤∈+v
min
时,获取风速

功率散点(v
i
,p
i
)为初始学习样本,其中,v
min
表示对应数据集内的最小风速;步骤S5013:基于各数据集总样本数{num 1,num 2,

,num T}与功率四分位点样本数num
f
,获得最终学习样本,具体为:当num i≤num
f
时,最终学习样本与初始学习样本保持一致;当num i>num
f
时,最终学习样本基于初始学习样本等间隔抽样获取。
[0013]作为优选,步骤S6中,设置功率曲线散点边界的具体过程为:剔除各数据集内风速宽度d
i
大于风速宽度阈值∈的风速宽度值,计算其余风速宽度的平均值功率曲线散点边界阈值σ设置为:
其中,k、h为实际经验参数。
[0014]作为优选,步骤S6中,当

σ≤v_pr
i
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种风电机组功率曲线异常散点剔除方法,其特征在于,包括以下步骤:步骤S1:获取目标机组的SCADA数据,所述SCADA数据包括状态码、风速和功率;步骤S2:按照状态码规则进行初步筛选,获得目标机组正常发电状态的风速、功率数据;步骤S3:基于DBSCAN聚类算法,获得风速

功率散点的主簇;步骤S4:将满足条件的数据归入主簇,确定主簇为正常数据,剔除其他簇数据;步骤S5:基于RANSAC回归模型,拟合功率曲线;步骤S6:设置功率曲线的散点边界,剔除异常散点。2.根据权利要求1所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S3的具体过程,包括以下步骤:步骤S301:设风速

功率散点集合为{(v1,p1),(v2,p2),

,(v
n
,p
n
)};步骤S302:对风速

功率散点集合{(v1,p1),(v2,p2),

,(v
n
,p
n
)}进行归一化处理,得到归一化后的风速

功率散点集合步骤S303:将归一化后的风速

功率散点集合输入至DBSCAN聚类模型,获得风速

功率散点的主簇。3.根据权利要求1所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S4中所述条件为:风速

功率散点(v
i
,p
i
)中v
i
≥v
额定
且p
i
≥p
额定
*0.95。4.根据权利要求1所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S5的具体过程,包括以下步骤:步骤S501:采用功率分层法获取风速

功率学习样本,所述学习样本的风速

功率散点中功率低于额定功率;步骤S502:基于学习样本,训练RANSAC回归模型,以实际功率p
i
为输入,预测对应的风速v_pr
i
。5.根据权利要求4所述的一种风电机组功率曲线异常散点剔除方法,其特征在于,步骤S501的具体过程,包括以下步骤:步骤S5011:基于T个功率区间{(0,δ),(δ,2δ),

,((T

1)*δ,p
额定
)},δ表示设置的单位功率长度,将风速

功率散点划分到T个数据集{dataset 1,dataset 2,

,dataset T}中,统计全部数据集的功率四分位点的样本数num
f
;步骤S5012:计算各数据集的风速宽度d
i
,根据设置的风速宽度阈值∈,获取初始学习样本,具体为:当v
i
≤∈+v
min
时,获取风速

功率散点(v
i
,p
i
)为初始学习样本,其中,v...

【专利技术属性】
技术研发人员:黄鑫王琳刘伟江
申请(专利权)人:浙江运达风电股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1