【技术实现步骤摘要】
一种发电设备状态评价参数权重挖掘方法、系统及电子设备
[0001]本专利技术涉及电厂设备
,尤其涉及一种发电设备状态评价参数权重挖掘方法、系统及电子设备。
技术介绍
[0002]电力系统检测设备在参数选取时,由于检测参数数据过多,且参数之间存在复杂的耦合性,给模型建立、模型计算以及计算机计算量带来很大影响。
[0003]目前对于电力设备参数选择没有比较科学的方法,通常是通过业务技术人员通过经验进行选取,不同的技术人员会有不同的选取思路,人为影响很大。同时,没有给出各类参数的对设备运行状态的的量化影响指标,很难符合实际情况。除此之外吴智群等人于2016年专利技术了一种通过对设备所有的监测参数进行主元分析,得到各参数的贡献率,从而获得该设备的关键监测参数并对新获得的参数进行权重分配的方法,分析方法过于依赖主成分分析算法,方法单一,很难综合的分析出监测参数的权重关系。因此,如何解决现有技术中过于依赖主成分分析算法,难以分析出监测参数的权重关系的问题。提升使用更自动化挖掘方法实现参数权重计算是当前亟待解决的技术问题。< ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种发电设备状态评价参数权重自动挖掘方法,其特征在于,方法包括:步骤一、获取发电厂中设备的工况数据;步骤二、对数据进行异常值处理,并对异常值进行填充;步骤三、计算测点间的相关关系特征;步骤四、基于测点间的相关性进行测点分组;步骤五、对每个测点进行互信息特征计算信息量的估算,得每个测点的互信息值;步骤六、筛选代表测点,以每个测点组的互信息值最大的测点确定为代表;步骤七、使用随机扰动方法确定代表测点的权重作为组权重;步骤八、测点分权,按照每组测点的互信息值比率划分组权重。2.根据权利要求1所述的发电设备状态评价参数权重自动挖掘方法,其特征在于,步骤一中获取预设时间段内发电厂设备的工况数据;在预设时间段内设置工况数据采集的时间间隔。3.根据权利要求1所述的发电设备状态评价参数权重自动挖掘方法,其特征在于,步骤二还包括:对获得的工况数据进行输入并记为序列B,进行每15min移动窗口计算中均值,得到的均值序列记为B1,当前值减去前15min移动窗口均值,形成新的序列B2,计算方式如下:Y
i
=X
i
‑
M
i
Y
i
为序列B2的第i个值,X
i
为序列B1的第i个值,M为序列B1的第i个值对应的窗口的均值;对序列B2用箱线图法标记异常值其中Q3和Q1为上下四分位,2.5为可调参数;算法如下:Q3=B2(75%分位数)Q1=B2(25%分位数)IQR=Q3
‑
Q1minval=Q1
‑
2.5
×
IQRmaxval=Q3+2.5
×
IQR在序列B2筛选大于maxvals或者小于minvals的数据记为异常数据;在原序列B中,将异常数据索引对应的值,置为空值,并用线性插值法填充,得到序列B3。4.根据权利要求1所述的发电设备状态评价参数权重自动挖掘方法,其特征在于,步骤三中,对步骤二获得的测点数据进行两两测点的相关关系特征计算得到n
×
n的相关系数矩阵;计算方式如下:其中,n为测点个数,X Y为两个不同测点;r值取值范围在
‑
1到1之间,r的绝对值越大,
表示变量X、Y之间的相关度越大。5.根据权利要求1所述的发电设备状态评价参数权重自动挖掘方法,其特征在于,步骤四的基于相关性进行测点分组具体方法为:采用分层聚类中的合并方法,先使得每维特征各成一类,然后通过合并相似度最大的两类,来减少类别数目;当两个聚类φ
i
、φ
j
中分别包含m和n个特征时,两个聚类的相似度度量定义为:分层聚类过程中每次将最相似的两个聚类,即SM
ij
值最大的两个聚类聚为一类;聚类停止的条件是类别之间的相似度不超过相似度阈值0.7。6.根据权利要求1所述的发电设备状态评价参数权重自动挖掘方法,其特征在于,步骤五还包括:(1)计算测点信息熵:特征的信息含量,假设数据集D由n个特征(f1,f2,
…
f
n
)所表示的N个实例组成,p(f
t
)是特征f
t
为不同可能值f
t
的概率;特征f
t
信息熵计算公式为:H(f
t
)=
‑
∑p(f
t
)logp(f
t
)(2)计算测点条件熵:已知某特征下,特征的信息含量,计算公式:H(f
t
|f
t
′
)=
‑
∑p(f
t
′
)∑p(f
t
技术研发人员:赵俊,张宜勇,孙永华,刘涛,王凯,
申请(专利权)人:山东鲁软数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。