当前位置: 首页 > 专利查询>三峡大学专利>正文

基于密度峰值聚类的高斯混合模型核电运行工况划分方法技术

技术编号:37777603 阅读:13 留言:0更新日期:2023-06-09 09:08
基于密度峰值聚类的高斯混合模型核电运行工况划分方法,包括以下步骤:对核电运行数据进行预处理,主要为数据降噪;利用PCA算法对高维核电运行数据进行特征提取;利用密度峰值聚类算法对PCA算法降维后的数据进行聚类,通过决策图的方式,确定核电运行工况数;利用高斯混合模型在聚类参考初值的情况下完成对核电工况的划分工作,并实现划分结果可视化。该方法能够解决传统高斯混合模型的缺点,提高工况划分的准确性,对于高维的核电厂运行数据的工况划分起到了良好的效果。工况划分起到了良好的效果。工况划分起到了良好的效果。

【技术实现步骤摘要】
基于密度峰值聚类的高斯混合模型核电运行工况划分方法


[0001]本专利技术涉及核电运行工况监测
,具体涉及一种基于密度峰值聚类的高斯混合模型核电运行工况划分方法。

技术介绍

[0002]核电的运行工况划分正是核电运行监测的基础,因此一种有效的核电运行工况划分方法十分重要。
[0003]目前,核电运行工况的划分仍然以专家经验为主,通过运行人员的经验来对核电运行工况进行划分,但是随着核电数字化和智能化,人工经验已无法满足核电厂的需求,所以急需发展一种自动划分核电运行工况的方法。由于核电厂内部过程的复杂性和影响因素的多样性,核电运行工况的准确个数无法直接得到,而聚类算法可对不同数据按内在相似性进行分类,因此可选用聚类方法来完成对核电运行工况的划分工作。
[0004]对于工况划分问题,有K

means聚类算法,TICC聚类算法以及传统的高斯混合模型可以作为选择,但是K

means聚类算法对初始聚类中心的依赖非常严重,对非凸数据集的聚类效果欠佳,且会出现局部最小值的情况。TICC聚类算法时间窗的大小需要靠先验知识确定,造成了该方法的适用性不强。传统的高斯混合模型存在着对聚类初值敏感,处理高维数据时计算难度大的问题。这三种聚类方法无法很好的适用于高维的核电厂时序数据。

技术实现思路

[0005]为解决上述技术问题,本专利技术提供一种基于密度峰值聚类的高斯混合模型核电运行工况划分方法,该方法能够解决传统高斯混合模型的缺点,提高工况划分的准确性,对于高维的核电厂运行数据的工况划分起到了良好的效果。
[0006]本专利技术采取的技术方案为:
[0007]基于密度峰值聚类的高斯混合模型核电运行工况划分方法,包括以下步骤:
[0008]步骤1:对核电运行数据进行预处理,对核电数据进行降噪;
[0009]步骤2:利用PCA算法对高维核电运行数据进行特征提取;
[0010]步骤3:利用密度峰值聚类算法对步骤2中PCA算法降维后的数据进行聚类,确定核电运行工况数;
[0011]步骤4:利用高斯混合模型在聚类参考初值的情况下完成对核电工况的划分工作,并实现划分结果可视化。
[0012]所述步骤1中,选择使用小波包分解重构的方法实现数据降噪。对输入信号,根据数据长度和波函数,确定合适的最大分解层数,将输入信号按小波树分解成多个成分,之后按照频率信息对每一层的各成分重新排序,按照设定规则挑选合适的成分后重构数据,达到降噪效果;
[0013]所述步骤2所包含的以下步骤:
[0014]S2.1、对原始数据进行归一化处理,消除量纲影响;
[0015]μ=(x1+...+x
n
/n;
[0016]其中:x1...x
n
表示各个时间点所记录的原始数据,n表示所记录到的数据个数;μ为变量的均值;
[0017][0018][0019]其中:δ为变量的标准差,x
i*
是标准化后的变量。最终得到归一化的数据矩阵X。其中数据矩阵X是指将原始数据按上述方法归一化后所得到的矩阵,每一列为各传感器的数据,一行代表一个时间点的数据。
[0020]S2.2、对归一化的数据矩阵X的协方差矩阵S进行特征值分解,获得对角矩阵Λ。
[0021][0022]Λ是协方差矩阵S的非负的实特征值D
i
并递减排列,V是正交单位特征向量。
[0023][0024]S2.3、取出对角矩阵Λ中最大的几个值及其对应的特征向量。
[0025]θ=(D1+...+D
m
)/(D1+...+D
i
);
[0026]D1...D
m
为从对角矩阵中最大的几个值;D1...D
i
为对角矩阵中的所有特征值。
[0027]S2.4、将原始特征投影到选取出的特征向量上,得到降维后的矩阵X
*
,从而达到降维的目的。
[0028]X
*
=XM;
[0029]M为步骤2.3中寻找到的几个最大特征值所对应的特征向量所组成的矩阵,该矩阵被作为投影向量矩阵。
[0030]所述步骤3所包含的以下步骤:
[0031]S3.1、计算聚类中心的局部密度ρ
i
:聚类中心的密度大于周围区域的密度,即寻找与聚类中心点距离d
ij
小于截断距离的数据点d
c
的个数。
[0032][0033]χ表示的是满足聚类中心点距离d
ij
小于截断距离的数据点d
c
的个数;j表示的任一散点。
[0034][0035]S3.2、计算聚类中心点的距离δ
i

[0036][0037]d
ij
指的是任意散点j与聚类中心点i的距离。j:ρ
i
>ρ
j
指的是在在所有的比i点的局部密度都大的样本点中,找到与i点距离最小的一个。
[0038]S3.3、决策图将同时满足具有较大密度和较大距离的点认定为类簇中心。这样的簇类中心的个数,即为工况数n。
[0039]所述步骤4所包含的以下步骤:
[0040]S4.1、将步骤3中获得的工况数作为聚类初始值的参考值;
[0041]S4.2、利用EM算法优化参数,同时利用模型的响应度来剔除响应度低的分类。
[0042]高斯混合模型的概率密度函数描述为:
[0043][0044]其中:α
k
为第k个高斯分布出现的概率,可得θ
k
为第k个高斯模型的参数,其中包含了均值和方差,f(x|θ
k
)就是第k个高斯模型的概率密度函数。
[0045]计算得到关于第k个高斯模型的响应度γ
k

[0046][0047]EM算法可分为两步,在进行这两步工作之前需要设定子分布模型的参数的初值。
[0048]E步:求取第k个分模型的对当前观测数据的响应度;
[0049]M步:迭代求取新一轮的模型参数:期望μ'
k
,方差权重α'
k
,当迭代满足|α
k

α
k
‑1|<=ε时即可终止迭代,ε为阈值。
[0050][0051][0052][0053]S4.3、获得划分结果,并使划分结果可视化。
[0054]所述步骤4.3所包括以下步骤:
[0055]步骤4.3.1:将划分结果,即各个工况的数据点集以不同颜色区分,不属于任何工况的数据点以原始点表示。
[0056]步骤4.3.2:将各个工况的所属数据点,按照所对应的时间戳依次还原至各个传感器数据之上;
[0057]与现有的人工经验划分方法以及其他聚类方法相比,本专利技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于密度峰值聚类的高斯混合模型核电运行工况划分方法,其特征在于包括以下步骤:步骤1:对核电运行数据进行预处理,对核电数据进行降噪;步骤2:利用PCA算法对高维核电运行数据进行特征提取;步骤3:利用密度峰值聚类算法对步骤2中PCA算法降维后的数据进行聚类,确定核电运行工况数;步骤4:利用高斯混合模型在聚类参考初值的情况下完成对核电工况的划分工作,并实现划分结果可视化。2.根据权利要求1所述基于密度峰值聚类的高斯混合模型核电运行工况划分方法,其特征在于:所述步骤1中,选择使用小波包分解重构的方法实现数据降噪;对输入信号,根据数据长度和波函数,确定合适的最大分解层数,将输入信号按小波树分解成多个成分,之后按照频率信息对每一层的各成分重新排序,按照设定规则挑选合适的成分后重构数据,达到降噪效果。3.根据权利要求1所述基于密度峰值聚类的高斯混合模型核电运行工况划分方法,其特征在于:所述步骤2所包含的以下步骤:S2.1、对原始数据进行归一化处理,消除量纲影响;μx...x/n;其中:x...x表示各个时间点所记录的原始数据;n表示所记录到的数据个数;μ为变量的均值;的均值;其中:δ为变量的标准差,是标准化后的变量;最终得到归一化的数据矩阵X;其中数据矩阵X是指将原始数据按上述方法归一化后所得到的矩阵,每一列为各传感器的数据,一行代表一个时间点的数据;S2.2、对归一化的数据矩阵X的协方差矩阵S进行特征值分解,获得对角矩阵Λ;Λ是协方差矩阵S的非负的实特征值D
i
并递减排列,V是正交单位特征向量;S=VΛV
T
;S2.3、取出对角矩阵Λ中最大的几个值及其对应的特征向量;θ=(D1+...+D
m
)/(D1+...+D
i
);D1...D
m
为从对角矩阵中最大的几个值;D1...D
i
为对角矩阵中的所有特征值;S2.4、将原始特征投影到选取出的特征向量上,得到降维后的矩阵X
*
,从而达到降维的目的;
X
C
=XM;M为步骤2.3中寻找到的几个最大特征值所对应的特征向量所组成的矩阵,该矩阵被作为投影向量矩阵。4.根据权利要求1所述基于密度峰值聚类的高斯混合模型核电运行工况划分方法,其特征在于:所述步骤3所包含的以下步骤:S3.1、计算聚类中心的局部密度ρ<...

【专利技术属性】
技术研发人员:崔文浩郑胜曾曙光曾祥云罗骁域
申请(专利权)人:三峡大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1