一种光伏功率异常数据的识别方法、装置及终端设备制造方法及图纸

技术编号:27744337 阅读:36 留言:0更新日期:2021-03-19 13:38
本发明专利技术适用于计算机领域,提供了一种光伏功率异常数据的识别方法、装置及终端设备,其中,所述方法包括:获取不同时间下光伏电站的光伏功率,得到时序功率数据集;采用K‑means聚类算法对所述时序功率数据集进行聚类,得到聚类数据集;基于所述聚类数据集,计算所述数据点和所述数据点所对应的聚类中心的偏差,得到偏差数据集;采用DBSCAN对所述偏差数据集进行聚类,得到异常数据距离阈值;基于所述聚类中心和所述异常数据距离阈值,对所述偏差数据集进行分类,得到异常数据集。本发明专利技术通过K‑means和DBSCAN二阶聚类算法对光伏功率异常数据识别,在全局维度利用数据特征提升了异常识别的灵活性和自适应性。

【技术实现步骤摘要】
一种光伏功率异常数据的识别方法、装置及终端设备
本专利技术属于计算机领域,尤其涉及一种光伏功率异常数据的识别方法、装置及终端设备。
技术介绍
在光伏电站的实际运行过程中,通信、数据采集设备故障以及人为因素均会使测量数据发生异常,不同异常诱因引起的数据异常表现不同,同时太阳辐照度、环境温湿度等气象因素也会导致光伏功率呈现出一定的波动性,异常数据和正常波动极易混淆。高质量的光伏功率数据是进行光伏研究的基础,因此须对光伏功率异常数据进行识别。对于未能实时监控太阳辐照度的光伏电站,光伏功率异常数据很难通过人工方法进行识别和清洗,同时人工辨别工作量大,易疏漏出错。工程上大多采用概率统计中的离群数据辨识方法来识别异常数据。通常,光伏功率随机性分量数据存在一定的波动范围,并且绝大部分数据分布在该波动范围之内,当某一数据出现在该波动范围之外时,则认为该数据为异常数据。但工程方法往往阈值设置单一机械,如简单设置功率偏差上下限,该类方法无法准确区分功率正常波动和异常偏差,造成识别误差大。
技术实现思路
有鉴于此,本专利技术提供了一种光伏功率异常本文档来自技高网...

【技术保护点】
1.一种光伏功率异常数据的识别方法,其特征在于,包括:/n获取不同时间下光伏电站的光伏功率,得到时序功率数据集;/n采用K-means聚类算法对所述时序功率数据集进行聚类,得到聚类数据集,所述聚类数据集包括聚类中心和各聚类中心所对应的数据点;/n基于所述聚类数据集,计算所述数据点和所述数据点所对应的聚类中心的偏差,得到偏差数据集;/n采用DBSCAN对所述偏差数据集进行聚类,得到异常数据距离阈值;/n基于所述聚类中心和所述异常数据距离阈值,对所述偏差数据集进行分类,得到异常数据集。/n

【技术特征摘要】
1.一种光伏功率异常数据的识别方法,其特征在于,包括:
获取不同时间下光伏电站的光伏功率,得到时序功率数据集;
采用K-means聚类算法对所述时序功率数据集进行聚类,得到聚类数据集,所述聚类数据集包括聚类中心和各聚类中心所对应的数据点;
基于所述聚类数据集,计算所述数据点和所述数据点所对应的聚类中心的偏差,得到偏差数据集;
采用DBSCAN对所述偏差数据集进行聚类,得到异常数据距离阈值;
基于所述聚类中心和所述异常数据距离阈值,对所述偏差数据集进行分类,得到异常数据集。


2.根据权利要求1所述的方法,其特征在于,采用K-means聚类算法对所述时序功率数据集进行聚类,得到聚类数据集,具体包括:
基于二维时序图,X轴为时间,Y轴为光伏功率,采用K-means聚类算法对所述时序功率数据集进行聚类,得到聚类数据集。


3.根据权利要求2所述的方法,其特征在于,采用K-means聚类算法对所述时序功率数据集进行聚类,得到聚类数据集,还包括:
根据当前光伏电站的太阳辐照度设置聚类时长;
设置聚类簇数K为1;
采用K-means聚类算法对所述时序功率数据集进行聚类,标记各时段聚类中心,得到聚类数据集。


4.根据权利要求1所述的方法,其特征在于,基于所述聚类数据集,计算所述数据点和所述数据点所对应的聚类中心的偏差,得到偏差数据集,具体包括:
各数据点功率减去各数据点所对应的聚类中心功率,得到各数据点所对应的偏差;
整合各数据点所对应的偏差,得到偏差数据集。


5.根据权利要求1所述的方法,其特征在于,采用DBSCAN对所述偏差数据集进行聚类,得到异常数据距离阈值,具体包括:
设置偏差数据集的半径Eps和半径区域中能够聚成一类的最少偏差个数MinPts;
使用DBSCAN算法对所述偏差数据集进行聚类,得到聚类结果;
判断聚类结果是否符合预设条件;

【专利技术属性】
技术研发人员:陈鑫王晓晨牛辰庚
申请(专利权)人:新奥数能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1