基于条件分布回归的风电场SCADA数据缺失的智能修复方法技术

技术编号:21771907 阅读:29 留言:0更新日期:2019-08-03 21:37
本发明专利技术提供一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,包括以下步骤:选择两个相关的传感器数据,其中一个为条件数据X,另一个为待修复数据Y;建立散点图;去除散点图中采样点的异常点;计算条件数据X中最大值与最小值的差值,求得条件数据X的分布范围,对数据等分为数十段;根据一段数据中待修复数据Y的条件分布集中度,决定是否舍弃该段,若数据集中,则保留,并将一段数据中Y中位数对应的采样点作为该段的代表点,若数据分散则舍弃该段;对于所有选出的代表点,将相邻的代表点进行线性插补;然后根据线性插补后X‑Y的函数关系进行映射。本发明专利技术解决了现有方法修复精度低,计算量较大的问题。

Intelligent Repair Method for SCADA Data Loss in Wind Farm Based on Conditional Distribution Regression

【技术实现步骤摘要】
基于条件分布回归的风电场SCADA数据缺失的智能修复方法
本专利技术涉及大数据处理领域,尤其是一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法。
技术介绍
风电场在复杂且恶劣的工作环境下,保持风电机组高性能运行是一项相对困难的工作。风电机组SCADA(远程数据监控系统)数据被广泛应用于机组运行状态分析研究中,其包含了风电机组组件运行状态的综合信息,SCADA能够远程获取风机运行状态数据,是风电场健康运行的保障。但是SCADA系统运行过程中,经常会遇到由于计算机硬件故障、软件错误、病毒、人为误操作等原因造成SCADA数据缺失或损坏。因此,为挽回由于数据缺失带来的损失,寻求一种通过大数据分析,利用已知数据对缺失部分数据进行估计的方法,是风电场运行维护人员需要解决的一个问题。在已发表的风电场实测数据缺失相关的文献中,修复缺失数据常采用预测和插补的方法。对于风速和风电功率的预测,传统方法主要包括基于自回归滑动平均模型的时间序列预测、多层前馈神经网络预测和组合预测等。WSWP概率预测方法的局限性在于函数关系式与实际结合不紧密,理论的公式应用到实际需要在初始模型的基础上添加适量的修正因子。虽然使用神经网络可以自动找出修正参数,但是神经网络会存在过拟合的问题,会对于异常数据分布进行误判,从而无法确保结果的准确性。除此之外,这些修正因子的权重根据历史统计结果获得,但是由于风速本身具有强烈的间歇性与波动性,此种预测方式误差较大的问题始终难以克服。
技术实现思路
本专利技术的目的在于克服现有技术中存在的不足,提供一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,能够对SCADA缺失数据进行修复,解决了现有方法修复精度低,计算量较大的问题。本专利技术采用的技术方案是:一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,包括以下步骤:步骤S1,选择两个相关的传感器数据,其中一个为条件数据X,另一个为待修复数据Y;条件数据X是完整的数据;然后将条件数据X为横坐标,待修复数据Y为纵坐标,建立散点图,散点图中,每一对条件数据和待修复数据确定一个采样点;步骤S2,去除散点图中采样点的异常点;步骤S3,计算条件数据X中最大值与最小值的差值,求得条件数据X的分布范围,对数据等分为数十段;步骤S4,根据一段数据中待修复数据Y的条件分布集中度,决定是否舍弃该段,若数据集中,则保留,并将一段数据中Y中位数对应的采样点作为该段的代表点,若数据分散则舍弃该段;步骤S5,对于所有选出的代表点,将相邻的代表点进行线性插补;然后根据线性插补后X-Y的函数关系进行映射,通过完整的条件数据X映射得到Y的修复后数据。进一步地,步骤S2中,使用3σ法则去除异常点;包括:a)计算条件数据X的标准差σ;b)每一个采样点横坐标xi与均值的差的绝对值与3倍标准差σ比较,若大于3倍标准差则剔除;c)重复步骤b)直到此次循环无任何剔除。进一步地,步骤S4具体包括:对于各段数据,进行如下处理:将一段数据中的待修复数据Y从小到大排列,选取该段中待修复数据Y的两个十分位点,若两个十分位点之差与该段数据中Y中位数的比值大于设定阈值,则认为分散,否则为集中;若为集中,则将该段数据中Y中位数对应的采样点作为该段的代表点;若为分散,则舍弃该段数据。本专利技术的优点在于:本专利技术通过修复缺失数据,能够更准确的对风机异常情况进行预警,对系统运行稳定和设备备用安排具有实际价值,同时也有助于更准确的估计发电量,辅助决策者制定发展战略,提高企业经济效益。附图说明图1为本专利技术的方法流程图。图2为本专利技术的散点图。具体实施方式下面结合具体附图和实施例对本专利技术作进一步说明。本专利技术提出一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,包括如下步骤:步骤S1,选择两个相关的传感器数据,其中一个为条件数据X,另一个为待修复数据Y;X与Y需要是相关的,例如,速度与加速度;待修复数据Y是可能存在缺失情况的数据;条件数据X是完整的数据;然后将条件数据X为横坐标,待修复数据Y为纵坐标,建立散点图,如图2所示,散点图中,每一对条件数据和待修复数据确定一个采样点;图2中的小圆点表示各采样点;步骤S2,去除散点图中采样点的异常点;例如,使用3σ法则去除异常点;a)计算条件数据X的标准差σ;b)每一个采样点横坐标xi与均值的差的绝对值与3倍标准差σ比较,若大于3倍标准差则剔除;c)重复步骤b)直到此次循环无任何剔除;步骤S3,计算条件数据X中最大值与最小值的差值,求得条件数据X的分布范围,对数据等分为数十段;此处数据应理解为X与Y,因为将X等分成80段,同时Y也相应等分为80段;步骤S4,根据一段数据中待修复数据Y的条件分布集中度,决定是否舍弃该段,若数据集中,则保留,并将一段数据中Y中位数对应的采样点作为该段的代表点,若数据分散则舍弃该段;对于各段数据,进行如下处理:将一段数据中的待修复数据Y从小到大排列,选取该段中待修复数据Y的两个十分位点,若两个十分位点之差与该段数据中Y中位数的比值大于设定阈值,则认为分散,否则为集中;若为集中,则将该段数据中Y中位数对应的采样点作为该段的代表点;若为分散,则舍弃该段数据;图2中的小三角表示选出的代表点;步骤S5,对于所有选出的代表点,将相邻的代表点进行线性插补;进行线性插补时,相邻的代表点用直线段连接,各条直线段所连成的整条线段就反应了X-Y的函数关系;然后根据线性插补后X-Y的函数关系进行映射,通过完整的条件数据X映射得到Y的修复后数据。本专利技术提出的方法与传统的确定性预测方法相比,克服了因风速的间歇性与波动性而导致的误差大的缺点,与神经网络预测法相比,具有更高的计算效率。通过修复缺失数据,能够更准确的对风机异常情况进行预警,对系统的稳定运行和设备的备用安排都有实际价值,同时也有助于更准确的估计发电量,辅助决策者制定发展战略,提高企业经济效益。最后所应说明的是,以上具体实施方式仅用以说明本专利技术的技术方案而非限制,尽管参照实例对本专利技术进行了详细说明,本领域的普通技术人员应当理解,可以对本专利技术的技术方案进行修改或者等同替换,而不脱离本专利技术技术方案的精神和范围,其均应涵盖在本专利技术的权利要求范围当中。本文档来自技高网...

【技术保护点】
1.一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,其特征在于,包括以下步骤:步骤S1,选择两个相关的传感器数据,其中一个为条件数据X,另一个为待修复数据Y;条件数据X是完整的数据;然后将条件数据X为横坐标,待修复数据Y为纵坐标,建立散点图,散点图中,每一对条件数据和待修复数据确定一个采样点;步骤S2,去除散点图中采样点的异常点;步骤S3,计算条件数据X中最大值与最小值的差值,求得条件数据X的分布范围,对数据等分为数十段;步骤S4,根据一段数据中待修复数据Y的条件分布集中度,决定是否舍弃该段,若数据集中,则保留,并将一段数据中Y中位数对应的采样点作为该段的代表点,若数据分散则舍弃该段;步骤S5,对于所有选出的代表点,将相邻的代表点进行线性插补;然后根据线性插补后X‑Y的函数关系进行映射,通过完整的条件数据X映射得到Y的修复后数据。

【技术特征摘要】
1.一种基于条件分布回归的风电场SCADA数据缺失的智能修复方法,其特征在于,包括以下步骤:步骤S1,选择两个相关的传感器数据,其中一个为条件数据X,另一个为待修复数据Y;条件数据X是完整的数据;然后将条件数据X为横坐标,待修复数据Y为纵坐标,建立散点图,散点图中,每一对条件数据和待修复数据确定一个采样点;步骤S2,去除散点图中采样点的异常点;步骤S3,计算条件数据X中最大值与最小值的差值,求得条件数据X的分布范围,对数据等分为数十段;步骤S4,根据一段数据中待修复数据Y的条件分布集中度,决定是否舍弃该段,若数据集中,则保留,并将一段数据中Y中位数对应的采样点作为该段的代表点,若数据分散则舍弃该段;步骤S5,对于所有选出的代表点,将相邻的代表点进行线性插补;然后根据线性插补后X-Y的函数关系进行映射,通过完...

【专利技术属性】
技术研发人员:袁烨孙川陈月仪唐秀川丁汉
申请(专利权)人:华中科技大学无锡研究院
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1