System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于大数据,涉及一种基于pca降噪、shap评价方法和相关系数检验相结合的锅炉过热汽温深度学习建模数据特征筛选方法。
技术介绍
1、大数据技术在火电机组中的应用日益广泛。深度学习建模方法利用电厂运行历史数据建立大数据模型,由于电厂实际运行数据具有高维度、扰动多等特点,需要通过数据降噪、特征筛选方法选取符合相关要求的特征。
2、pca主成分分析方法能够将高维度的数据降维,仅保留最主要的特征,去除噪声和不重要的特征。然而,pca不具有可解释性,重构后的低维特征的含义不明。
3、shap评价方法是一种源于博弈论的交互性解释方法,通过计算单个输入特征对输出的贡献度,该方法能够解释模型的预测。相关性系数是研究变量间线性相关程度的量,其取值在-1到1之间。变量之间的相关性系数绝对值越接近1,其线性相关程度越强。如果两个输入特征线性相关,则说明其中一个特征可以由另一个特征线性表示,对于机器学习而言二者作用相同,为提高计算效率,应仅保留其中一个特征。
技术实现思路
1、专利技术目的:本专利技术的目的是针对锅炉过热器汽温深度学习建模存在数据维度大、包含扰动的问题,提出一种利用pca降噪、shap评价方法与相关性系数检验相结合的方法,筛选出对输出影响较大的输入特征。
2、技术方案:本专利技术的一种基于shap评价的过热汽温深度学习建模特征筛选方法,包括以下步骤:
3、(1)使用pca方法提取并去除所有锅炉过热汽温深度学习建模数据中的噪声,得到降
4、(2)根据过热汽温深度学习建模需求,从降噪后的数据集中划分输入特征和输出特征;利用输入特征和输出特征训练反向传播神经网络,作为shap评价的博弈模型;同时根据时间序列相关性计算方法,计算各输入特征之间的相关系数;根据shap评价方法原理和博弈模型,计算各输入特征的shap值;
5、(3)设定shap值和相关系数的阈值,根据各项输入特征的shap值以及相关系数大小筛选得到最终输入特征。
6、进一步的,锅炉过热汽温深度学习建模数据为锅炉过热器实际运行数据,数据特征包括过热器出口汽温数据以及一系列其他运行参数,其他运行参数具体包括机组功率、蒸汽流量、过热器内部各测点温度、减温水阀门开度和压力、锅炉煤量、风门开度、高压加热器压力和进口焓。
7、进一步的,噪声提取和去除步骤如下:
8、(11)使用pca主成分分析方法对建模数据进行降维,得到主成分矩阵为:
9、y=px
10、其中,x为原始数据矩阵;y为降维后的主成分矩阵;p为pca变换矩阵,由x的特性决定;
11、(12)使用pca逆变换方法将主成分数据还原为原始维度:
12、x′=p-1y
13、其中,x’为还原后的具有原始维度的数据矩阵,p-1为pca变换矩阵p的逆矩阵;
14、(13)获取和剔除噪声数据;
15、噪声数据表示为:
16、δ=x′-x
17、其中,δ为噪声矩阵;得到噪声后,对噪声分布情况进行检验,若其分布符合高斯分布,则认为噪声提取正确;若不符合高斯分布,则需重新调整保留方差百分比,得到新的pca变换矩阵,重新检验噪声分布情况;此时,矩阵x’中即为降噪后的数据。
18、进一步的,输出特征为过热蒸汽温度,输入特征为其余所有特征。
19、进一步的,各输入特征之间的相关系数γx,y计算公式为:
20、
21、其中,x和y表示两个不同的输入特征数据序列,和分别表示x和y的平均值,σ表示对输入特征中所有数据点进行加和,下标i表示输入特征序列中的某个数据。
22、进一步的,各输入特征的shap值的计算公式为:
23、
24、其中,φ(j|n)表示输入特征j的shap值;n是全部输入特征集合;s为从n中除去输入特征j后得到的输入特征集合;n为n中输入特征的数量;f为博弈模型。
25、进一步的,步骤(3)具体为:
26、(31)将各输入特征的shap值降序排列,取中位数作为shap值的阈值;各输入特征之间的相关性系数阈值取0.9,即当两个输入特征的shap值序列相关度达到90%时其线性相关;
27、(32)对于所有输入特征,若其shap值高于阈值,则予以保留,否则予以剔除;
28、(33)对于经过步骤(32)筛选后的特征,依次检验每两个输入特征之间的相关性系数,若其相关性系数超过阈值,则剔除其中shap值较低的输入特征,重复此过程,直到所有输入特征间相关系数均不超过相关性系数阈值;
29、经过步骤(33)筛选后的特征即为最终输入特征。
30、基于相同的专利技术构思,本专利技术的一种基于shap评价的过热汽温深度学习建模特征筛选系统,包括:
31、数据处理单元,用于使用pca方法提取并去除所有锅炉过热汽温深度学习建模数据中的噪声,得到降噪后的数据作为相关系数计算和博弈神经网络训练的数据;
32、数据计算单元,用于根据过热汽温建模需求,从降噪后的数据集中划分输入特征和输出特征;利用输入特征和输出特征训练反向传播神经网络,作为shap评价的博弈模型;同时根据时间序列相关性计算方法,计算各输入特征之间的相关系数;根据shap评价方法原理和博弈模型,计算各输入特征的shap值;
33、输入特征筛选单元,用于设定shap值和相关系数的阈值,根据各项输入特征的shap值以及相关系数大小筛选得到最终输入特征。
34、基于相同的专利技术构思,本专利技术的一种电子设备,所述设备包括:
35、存储有可执行程序代码的存储器;
36、与所述存储器耦合的处理器;
37、所述处理器调用所述存储器中存储的所述可执行程序代码,执行如上述的基于shap评价的过热汽温深度学习建模特征筛选方法的步骤。
38、基于相同的专利技术构思,本专利技术的一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如上述的基于shap评价的过热汽温深度学习建模特征筛选方法的步骤。
39、有益效果:与现有技术相比,本专利技术的优点为:使用pca方法对数据进行降噪处理,能够减少数据采集现场扰动和噪声的影响;使用shap评价和相关性系数检验相结合的方法对过热汽温深度学习建模数据进行筛选,在避免了使用经验方法人工选取特征的主观性的同时,考虑了输入特征数据间的相关性,进一步去除了shap值无法筛选出的冗余特征,提高了特征筛选结果的合理性,从而能够提高以所筛选特征为输入的过热汽温深度学习建模的精度。
本文档来自技高网...【技术保护点】
1.一种基于SHAP评价的过热汽温深度学习建模特征筛选方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于SHAP评价的过热汽温深度学习建模特征筛选方法,其特征在于,锅炉过热汽温深度学习建模数据为锅炉过热器实际运行数据,数据特征包括过热器出口汽温数据、机组功率、蒸汽流量、过热器内部各测点温度、减温水阀门开度和压力、锅炉煤量、风门开度、高压加热器压力和进口焓。
3.根据权利要求1所述的一种基于SHAP评价的过热汽温深度学习建模特征筛选方法,其特征在于,噪声提取和去除步骤如下:
4.根据权利要求1所述的一种基于SHAP评价的过热汽温深度学习建模特征筛选方法,其特征在于,输出特征为过热蒸汽温度,输入特征为其余所有特征。
5.根据权利要求1所述的一种基于SHAP评价的过热汽温深度学习建模特征筛选方法,其特征在于,各输入特征之间的相关系数γx,y计算公式为:
6.根据权利要求1所述的一种基于SHAP评价的过热汽温深度学习建模特征筛选方法,其特征在于,各输入特征的SHAP值的计算公式为:
7.根据权利要求1
8.一种基于SHAP评价的过热汽温深度学习建模特征筛选系统,其特征在于,包括:
9.一种电子设备,其特征在于,所述设备包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令被调用时,用于执行如权利要求1-7任一项所述的基于SHAP评价的过热汽温深度学习建模特征筛选方法的步骤。
...【技术特征摘要】
1.一种基于shap评价的过热汽温深度学习建模特征筛选方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于shap评价的过热汽温深度学习建模特征筛选方法,其特征在于,锅炉过热汽温深度学习建模数据为锅炉过热器实际运行数据,数据特征包括过热器出口汽温数据、机组功率、蒸汽流量、过热器内部各测点温度、减温水阀门开度和压力、锅炉煤量、风门开度、高压加热器压力和进口焓。
3.根据权利要求1所述的一种基于shap评价的过热汽温深度学习建模特征筛选方法,其特征在于,噪声提取和去除步骤如下:
4.根据权利要求1所述的一种基于shap评价的过热汽温深度学习建模特征筛选方法,其特征在于,输出特征为过热蒸汽温度,输入特征为其余所有特征。
5.根据权利要求1所述的一种基于shap评...
【专利技术属性】
技术研发人员:潘蕾,张文灿,王钱超,陈帅尧,张君正,刘振祥,
申请(专利权)人:东南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。