System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种风电机组运行数据中健康状态特征的提取方法技术_技高网

一种风电机组运行数据中健康状态特征的提取方法技术

技术编号:40060920 阅读:10 留言:0更新日期:2024-01-16 22:40
本发明专利技术公开了一种风电机组运行数据中健康状态特征的提取方法,包括S1):数据清洗:风电机组通过SCADA系统将数据传输到数据库中,利用SS‑AR模型进行清洗、修正;S2):去除冗余特征:利用进化算法、K均值聚类方法与堆叠自编码网络去除冗余特征;S3):特征选择:利用CKLP算法进行特征选择,有效识别数据中的噪声特征,去除冗余特征,挖掘出健康状态预测所需要的有价值特征。

【技术实现步骤摘要】

本专利技术涉及风电数据处理和特征提取,具体涉及一种风电机组运行数据中健康状态特征的提取方法


技术介绍

1、风电机组通常安装偏远地区,其运行条件恶劣。为了更好的监测风电机组的运行状态和降低运维成本,通常安装scada系统。该系统通过大量传感器实时采集大量数据,回传到集控中心服务器。利用scada数据进行状态评估和健康管理是行业关注的重要问题。

2、scada数据中包含环境数据如风速、风向和温度等,同时包含风电机组运行状态数据如电机转速、温度、发电机电流等,这些数据为实时运行数据,并不能直接反映风电机组健康状态。同时因为环境、电网和设备或传感器故障等方面因素的影响,scada数据包含大量噪声数据。利用scada数据进行分析,需要首先对数据进行处理,并提取其中可以反映风电机组和关键部件的数据特征,这是进行后续健康评估、故障预测和优化运维的基础。


技术实现思路

1、鉴于此,提出一种风电机组运行数据中健康状态特征的提取方法,来提取运行数据中的健康特征。

2、具体方案如下:

3、一种风电机组运行数据中健康状态特征的提取方法,

4、s1):数据清洗:风电机组通过scada系统将数据传输到数据库中,利用ss-ar模型进行清洗、修正;

5、s2):去除冗余特征:利用进化算法、k均值聚类方法与堆叠自编码网络去除冗余特征;

6、s3):特征选择:利用cklp算法进行特征选择。

7、所述数据清洗包括如下步骤:

>8、s11):利用super smoother算法识别异常数据,选取大小为w的滑动窗口,所述滑动窗口中包含的数据为h,h={h1,h2,…,hn},

9、找出满足所示期望偏差最小的平滑预测值g;

10、s12):对原始记录数据值h进行局部线性回归估计,以h的数值hi为基点,计算hi和平滑值gi的交叉验证误差;通过优化窗口宽度j调节hi平滑程度,选择最优的平滑带宽控制hi的平滑度;

11、平滑值计算公式为:

12、所述交叉验证误差计算公式为:

13、s13):计算gi与hi差值得到偶然误差,计算窗口内所有数据误差群的均值和标准差,并进行标准化处理,依据3σ原理,将(μ-3σ,μ+3σ)区间外的数值定位异常值,将异常值放入异常数据集;

14、s14):生成异常数据修正集;

15、对于异常数据rj,设异常值为l,

16、令

17、求解得到l的原始解l1和l2,且设定l1<l2;

18、对于异常数据rj,必然有rj≤l1或rj>l2;

19、当rj≤l1时,数据rj的候选值取l1,当rj>l2时,数据rj的候选值取l2;

20、将所有异常数据替换为候选数据,得到候选数据集γ';

21、s15):迭代优化异常数据;

22、若候选数据集中有c个正常数据,则使用更新候选数据得到最终修复值;其中,为修复后的数据,c是常量,φk为ar模型参数,εi为白噪声点;

23、若候选数据集中有c个数据不全为正常数据,则对i-c至i-1个数据利用对异常数据进行更新得到修复后的数据其中,k、c为利用数学统计估算得到的值。

24、所述进化算法为多种群协同进化算法,多种群协同进化算法将进化过程划分为全局探索和加速收敛两阶段;

25、在全局探索阶段,根据新个体的适应值判断是否保留该精英个体,如果新个体的适应值比现有pareto非支配解的适应值高则保留,否则直接放弃;

26、在收敛阶段,采用种群合并策略,逐渐淘汰较差的子种群,将优良个体并入到更优种群之中,加入惩罚机制,对进化停滞的种群,将进化停滞的种群的个体迁移向到其他种群,增强其他种群的探索能力。

27、在全局探索阶段,采用多种群搜索策略,利用k-means聚类算法将种群分为多个不同的子种群,子种群采用相同的进化策略搜集适应性好的个体。

28、多种群协同进化算法的适应度函数定义两个目标,即堆叠自编码器的降维率最大和堆叠自编码器的复现精度最高;

29、堆叠自编码器的降维率最大为f1=max(r(pop));

30、堆叠自编码器的复现精度最高为f2=max(m(pop));其中,pop为进化种群的个体;

31、将目标函数归一化处理后构造适应度函数:

32、

33、f适适应度函数,α、β为缩放系数。

34、k均值聚类方法为,在k均值聚类分群的目标函数种,加入特征权值w’,获取新的均值聚类函数,并计算特征权值的值wξ,将所述特征权值的值wξ与特征权值阈值进行比较,若则为冗余特征,进行剔除,否则,则进行保留;

35、所述均值聚类函数为

36、

37、其中,θ为ωξ的系数,

38、u(o*p)为均值聚类的分割矩阵,根据聚类目标函数计算得到,

39、uρ,ξ是u中的元素,uρ,ξ=1表示第ρ个数据特征属于ξ类,

40、约束条件为,用以约束每个数据智能归属一类;

41、d(xρ,ξ,zυ,ξ)表示两个数据ρ和υ之间的距离d(xρ,ξ,zυ,ξ)=(xρ,ξ-zυ,ξ)2。

42、堆叠自编码网络为五层sae结构,第二层sae的维度最小,且第二层sae既是编码器的输出,也是第四层sae编码器的输入,第五层利用softmax层进行特征分类;

43、在特征重构过程中,去除冗余后的特征表示为向量xt=[x1,…xn]t,由于中间隐含层的激活函数为mish函数,则堆叠自编码sae中各隐含层的输出可表示为:

44、

45、其中,

46、为sae编码器第一层的输入;

47、为sae编码器第q层的输出;

48、为编码器sae第q层的权值与阈值;

49、mish为编码器sae第q层的激活函数;

50、sae编码器最后一层的输出即为重构后的特征,即:

51、

52、sae损失函数定义为:

53、

54、其中,

55、j(b,b,x,y)=||x-y||2b,b为网络参数;γ为样本总数;λ为权重衰减系数;δ为网络总层数;sl为第l层神经元总节点数;

56、sae编码器的各层初始参数b,b可通过预训练确定后再通过微调对参数进行优化,在进行参数微调时,以sae损失函数为目标函数,将参数的更新转化为函数优化问题,采用梯度下降法更新参数b和b。

57、特征选择包括如下步骤,

58、s31):构建样本的最邻近图

59、对于样本ψ=(ψ1,ψ2,…ψo),定义从原始空间到高维核空间的非线性映射φ,根据核再生理论,当两个样本ψτ,ψπ,τ≠π接近时,即φ(xτ)与φ(本文档来自技高网...

【技术保护点】

1.一种风电机组运行数据中健康状态特征的提取方法,其特征在于:

2.根据权利要求1所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:所述数据清洗包括如下步骤:

3.根据权利要求1所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:所述进化算法为多种群协同进化算法,多种群协同进化算法将进化过程划分为全局探索和加速收敛两阶段;

4.根据权利要求3所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:在全局探索阶段,采用多种群搜索策略,利用K-means聚类算法将种群分为多个不同的子种群,子种群采用相同的进化策略搜集适应性好的个体。

5.根据权利要求3所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:多种群协同进化算法的适应度函数定义两个目标,即堆叠自编码器的降维率最大和堆叠自编码器的复现精度最高;

6.根据权利要求1所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:K均值聚类方法为,在K均值聚类分群的目标函数种,加入特征权值W’,获取新的均值聚类函数,并计算特征权值的值wν,将所述特征权值的值wξ与特征权值阈值进行比较,若则为冗余特征,进行剔除,否则,则进行保留;

7.根据权利要求1所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:堆叠自编码网络为五层SAE结构,第二层SAE的维度最小,且第二层SAE既是编码器的输出,也是第四层SAE编码器的输入,第五层利用softmax层进行特征分类;

8.根据权利要求1所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:特征选择包括如下步骤,

...

【技术特征摘要】

1.一种风电机组运行数据中健康状态特征的提取方法,其特征在于:

2.根据权利要求1所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:所述数据清洗包括如下步骤:

3.根据权利要求1所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:所述进化算法为多种群协同进化算法,多种群协同进化算法将进化过程划分为全局探索和加速收敛两阶段;

4.根据权利要求3所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:在全局探索阶段,采用多种群搜索策略,利用k-means聚类算法将种群分为多个不同的子种群,子种群采用相同的进化策略搜集适应性好的个体。

5.根据权利要求3所述的风电机组运行数据中健康状态特征的提取方法,其特征在于:多种群协同进化算法的适应度函数定义两个...

【专利技术属性】
技术研发人员:豆书贤王文峰卞海兵许守亮姚瑞锋石天庆秦海山孙小林武钰航段书用高贵兵
申请(专利权)人:华电郑州机械设计研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1