一种光伏电站异常数据清洗的方法技术

技术编号:32458043 阅读:11 留言:0更新日期:2022-02-26 08:40
本发明专利技术涉及一种光伏电站异常数据清洗的方法,该方法包括以下步骤:

【技术实现步骤摘要】
一种光伏电站异常数据清洗的方法


[0001]本专利技术涉及光伏发电
,尤其涉及一种光伏电站异常数据清洗的方法。

技术介绍

[0002]近年来,光伏发电发展迅速,装机容量快速增长,使得光伏发电系统智能化运行显得尤为重要。光伏发电高质量和高可靠性的数据是光伏系统实现智能运行的基础。然而光伏发电系统在实际运行过程中采集到的运行数据存在大量的异常值,造成这些异常值的原因多种多样,包括数据采集传播系统的信号噪声、最大功率跟踪异常以及阵列停机等因素。对这些异常数据的清洗是提高数据质量、实现光伏智能运行的关键环节,具有重要意义。
[0003]目前,有关新能源发电系统数据清洗的研究大致可以分为两种,分别是全局概率统计法和基于人工智能的数据清洗方法。全局概率统计方法通过对功率曲线类似的历史样本数据建立统计学模型实现异常数据的识别和清洗,方法较为成熟,但是其缺点在于当大量异常数据局部堆积时会造成部分数据误清洗,且全局概率统计方法的数据筛选结构易受到样本数据分布的影响。基于人工智能的数据清洗方法对理论要求弱,技术性强,通过计算机进行大量重复地计算实现异常数据的识别和清洗,但其缺点在于人工智能方法的泛化能力需要对大量的样本数据进行训练学习,实际过程中样本数据量难以保证;另外,部分人工智能方法所得结果的物理意义难以解释。
[0004]由于光伏出力会同时受到多维外部因素的影响,其中主要的影响因素为辐照度和温度。大多数学者考虑从环境因素入手研究其与电气参数之间的关系,从而判断光伏电站异常数据,但大多数研究只考虑了某一单层关系,例如温度与电压之间的单层关系或辐照度和功率的单层关系。而事实上,光伏电站的实际运行数据受到辐照度、温度等多方面的影响,其出力分布受到多变量的影响。

技术实现思路

[0005]本专利技术所要解决的技术问题是提供一种具有有效性和可行性的光伏电站异常数据清洗的方法。
[0006]为解决上述问题,本专利技术所述的一种光伏电站异常数据清洗的方法,包括以下步骤:

选取原始数据:收集某个光伏电站的历史运行数据以及历史气象数据为原始数据样本,并确认样本分布情况;

建立数据索引:对原始数据样本中的环境数据以及光伏电站历史功率数据进行标签,按照时间轴进行数据对齐;

二步分位数算法的第一步:按照辐照度和功率数据关系进行清洗;

二步分位数算法的第二步:按照温度和功率数据关系进行清洗;

清洗结果整理:将第二步清洗后的数据进行重新整理,按照辐照度、温度以及功率三种参数种类对结果数据进行重构,使正常数据的分布趋势符合光伏阵列多维理论电气参数关系即可。
[0007]所述步骤

中环境数据是指辐照度数据和温度数据。
[0008]所述步骤

中按照辐照度和功率数据关系进行清洗的方法是指先索引原始数据中的辐照度与光伏输出功率数据,并清洗辐照度零值点数据;然后设置分位数参数,按分位数算法获得样本数据的异常值内限,并以此为依据对数据进行划分,最后将数据异常值内限之外的数据进行清洗。
[0009]所述步骤

中按照温度和功率数据关系进行清洗的方法是指先索引第一步清洗后的数据中温度与光伏输出功率数据;然后设置分位数参数,按分位数算法获得样本数据的异常值内限,并以此为依据对数据进行划分,最后将数据异常值内限之外的数据进行清洗。
[0010]所述数据划分公式为:;;式中:Y
l,i
表示第i维的异常数据集,Y
n,i
表示第i维的正常数据集;x
j
表示第j个异常数据,x
k
表示第k个正常数据;F
1,i
表示数据异常值内限中的下限,F
u,i
表示数据异常值内限的上限;S1,S2分别表示异常数据和正常数据的个数;i为维度;R为实数集。
[0011]本专利技术与现有技术相比具有以下优点:1、本专利技术考虑多个环境因素来实现光伏阵列异常数据清洗,利用分位数算法分两步对光伏阵列异常数据进行清洗,从而实现光伏电站异常数据的有效识别和筛选。
[0012]2、采用本专利技术方法后,不仅能有效识别不同条件下的异常数据,还能将底部堆叠的异常值准确识别,说明本专利技术方法对于光伏电站数据清洗具有有效性和可行性。同时经测试,采用本专利技术方法后异常数据错误识别率远远小于单一四分位数方法。
附图说明
[0013]下面结合附图对本专利技术的具体实施方式作进一步详细的说明。
[0014]图1为本专利技术的流程图。
[0015]图2为本专利技术不同光伏电站运行数据清洗的结果。其中:左图为350M202M4M355汇流箱数据,右图为350M202M4M356汇流箱数据。
具体实施方式
[0016]如图1所示,一种光伏电站异常数据清洗的方法,包括以下步骤:

选取原始数据:收集某个光伏电站的历史运行数据以及历史气象数据为原始数据样本,并确认样本分布情况。
[0017]⑵
建立数据索引:
对原始数据样本中的环境数据(辐照度、温度)以及光伏电站历史功率数据进行标签,按照时间轴进行数据对齐,方便后续索引与分析。
[0018]⑶
二步分位数算法的第一步:按照辐照度和功率数据关系进行清洗。
[0019]先索引原始数据中的辐照度与光伏输出功率数据,并清洗辐照度零值点数据,避免零值点数据堆积影响分位数算法识别;然后设置分位数参数,按分位数算法获得样本数据的异常值内限,并以此为依据对数据进行划分,最后将数据异常值内限之外的数据进行清洗。
[0020]其中:数据划分公式为:;;式中:Y
l,i
表示第i维的异常数据集,Y
n,i
表示第i维的正常数据集;x
j
表示第j个异常数据,x
k
表示第k个正常数据;F
1,i
表示数据异常值内限中的下限,F
u,i
表示数据异常值内限的上限;S1,S2分别表示异常数据和正常数据的个数;i为维度;R为实数集。
[0021]⑷
二步分位数算法的第二步:按照温度和功率数据关系进行清洗。
[0022]先索引第一步清洗后的数据中温度与光伏输出功率数据;然后设置分位数参数,按分位数算法获得样本数据的异常值内限,并以此为依据对数据进行划分,最后将数据异常值内限之外的数据进行清洗。
[0023]其中:数据划分公式同步骤


[0024]⑸
清洗结果整理:将第二步清洗后的数据进行重新整理,按照辐照度、温度以及功率三种参数种类对结果数据进行重构,使正常数据的分布趋势符合光伏阵列多维理论电气参数关系即可。
[0025]实施例 一种光伏电站异常数据清洗的方法,包括以下步骤:

采用某光伏电站两个汇流箱(350M202M4M355汇本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种光伏电站异常数据清洗的方法,包括以下步骤:

选取原始数据:收集某个光伏电站的历史运行数据以及历史气象数据为原始数据样本,并确认样本分布情况;

建立数据索引:对原始数据样本中的环境数据以及光伏电站历史功率数据进行标签,按照时间轴进行数据对齐;

二步分位数算法的第一步:按照辐照度和功率数据关系进行清洗;

二步分位数算法的第二步:按照温度和功率数据关系进行清洗;

清洗结果整理:将第二步清洗后的数据进行重新整理,按照辐照度、温度以及功率三种参数种类对结果数据进行重构,使正常数据的分布趋势符合光伏阵列多维理论电气参数关系即可。2.如权利要求1所述的一种光伏电站异常数据清洗的方法,其特征在于:所述步骤

中环境数据是指辐照度数据和温度数据。3.如权利要求1所述的一种光伏电站异常数据清洗的方法,其特征在于:所述步骤

中按照辐照度和功率数据关系进行清洗的方法是指先索引原始数据中的辐照度与光伏输出功率数据,...

【专利技术属性】
技术研发人员:吕清泉马明张睿骁张健美张彦琪张珍珍张金平王定美周强高鹏飞李津朱红路蒋婷婷史淯城
申请(专利权)人:国网甘肃省电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1