预警性异常检测与风险规避的工业设备控制方法及装置制造方法及图纸

技术编号:39420418 阅读:13 留言:0更新日期:2023-11-19 16:09
本公开涉及一种预警性异常检测与风险规避的工业设备控制方法及装置,方法包括:获取待控制设备在当前时刻的可控状态及预设参数的统计量状态;将可控状态及统计量状态输入控制动作决策模型,以最大化收益为目标,通过控制动作决策模型的目标函数和控制动作决策模型的约束条件,确定每个预设控制动作的选取概率;根据预设的动作选取策略和每个预设控制动作的选取概率,确定目标控制动作;根据目标控制动作控制待控制设备。通过上述技术方案,可以将当前时刻的可控状态及预设参数的统计量状态输入控制动作决策模型,以实时生成控制动作并控制设备,由此可以在检测到异常特征时能够及时采取相应的控制动作进行异常处理,降低设备异常带来的损失。设备异常带来的损失。设备异常带来的损失。

【技术实现步骤摘要】
预警性异常检测与风险规避的工业设备控制方法及装置


[0001]本公开涉及工业设备
,具体地,涉及一种预警性异常检测与风险规避的工业设备控制方法及装置。

技术介绍

[0002]相关技术中,为了实现对工业设备的控制,多根据工业设备的运行状态构建马尔可夫决策模型(Markov Decision Process,MDP),并基于最快变化检测(Quickest Change Detection,QCD)的视角来处理MDP模型变化的最优控制问题。然而,相关技术中虽然运用了QCD来研究MDP的变化问题,但仅关注于在不同MDP的最佳策略切换控制,并未实现自适应实时输出控制策略,难以应用于工业报警环境中。

技术实现思路

[0003]本公开的目的是提供一种预警性异常检测与风险规避的工业设备控制方法及装置,以解决上述技术问题。
[0004]为了实现上述目的,本公开第一方面提供一种预警性异常检测与风险规避的工业设备控制方法,所述方法包括:
[0005]获取待控制设备在当前时刻的可控状态及预设参数的统计量状态,所述统计量状态用于表征所述待控制设备的变化状态;
[0006]将所述可控状态及所述统计量状态输入控制动作决策模型,以最大化收益为目标,通过所述控制动作决策模型的目标函数和所述控制动作决策模型的约束条件,确定每个预设控制动作的选取概率;
[0007]根据预设的动作选取策略和所述每个预设控制动作的所述选取概率,确定目标控制动作;
[0008]根据所述目标控制动作控制所述待控制设备
[0009]可选地,所述获取所述待控制设备在当前时刻的统计量状态,包括:
[0010]基于预设的概率密度函数,确定第一时间段内每个时刻的所述预设参数的对数似然比,其中,所述概率密度函数包括第一概率密度函数和第二概率密度函数,所述第一概率密度函数用于表征所述预设参数的观测值位于变化点前的概率分布,所述第二概率密度函数用于表征所述预设参数的观测值位于所述变化点后的概率分布,所述变化点为所述观测值的统计平均值发生变化的时间点,所述第一时间段用于表征起始时刻至当前时刻的时间段;
[0011]针对每个第二时间段,确定对数似然比累积和,所述对数似然比累积和用于表征所述第二时间段内每个时刻的所述预设参数的对数似然比的和值,所述第二时间段用于表征所述第一时间段内的每个时刻至当前时刻的时间段;
[0012]将最大的对数似然比累积和确定为所述预设参数的统计量;
[0013]根据所述统计量以及统计量状态与统计量之间的预设对应关系,确定所述待控制
设备在当前时刻的统计量状态。
[0014]可选地,所述目标函数为:
[0015][0016][0017][0018][0019]其中,χ表示由统计量状态、可控状态、变化时间状态及当前时间状态构成的四元组状态,S表示由四元组状态构成的状态空间,a表示预设控制动作,A表示预设控制动作的动作状态空间,表示目标优化变量,R(χ,a)表示在四元组状态χ下执行预设控制动作a得到的收益,表示取四元组状态χ中当前时刻n的可控状态x
n
,x
n
表示n时刻的可控状态,a
n
表示n时刻选取的目标控制动作,R(x
n
,a
n
)表示n时刻在可控状态x
n
下执行预设控制动作a
n
得到的收益,π
χ
表示状态的稳态概率,f
a
(χ)表示预设控制动作选取函数,表示在状态χ下选取预设控制动作a的概率,d0表示预设的工业设备损坏相关参数值,x
m
表示预设的最小可控状态,x0表示预设的起始可控状态,θ表示任意常数。
[0020]可选地,所述约束条件包括状态约束条件和安全约束条件,其中,所述状态约束条件用于表征所述待控制设备所在系统达到稳态状态的条件,所述安全约束条件用于表征维持所述待控制设备处于正常运行状态的条件。
[0021]可选地,所述状态约束条件为:
[0022][0023][0024][0025][0026]其中,χ表示由统计量状态、可控状态、变化时间状态以及当前时间状态构成的状态空间,S表示由四元组状态构成的状态空间,a表示预设控制动作,A表示预设控制动作的动作状态空间,π
χ
表示状态的稳态概率,f
a
(χ)表示预设控制动作选取函数,表示在状态χ下选取预设控制动作a的概率,表示目标优化变量,表示从状态χ执行预设控制动作a时,得到下一状态χ

的概率,π
χ

表示状态χ

的稳态概率。
[0027]可选地,所述安全约束条件为:
[0028][0029]其中,P
th
表示设备损害概率的阈值,Ψ表示状态空间中的状态属于第一预设状态的集合,第一预设状态用于表征设备异常得到安全处理的状态,χ
e
表示第一预设状态,表
示状态空间中的状态属于第二预设状态的集合,第二预设状态用于表征设备异常无法得到安全处理的状态,χ
c
表示第二预设状态,表示属于第二预设状态下的优化变量,表示属于第一预设状态下的优化变量。
[0030]可选地,所述以最大化收益为目标,通过所述控制动作决策模型的目标函数和所述控制动作决策模型的约束条件,确定每个预设控制动作的选取概率,包括:
[0031]确定所述目标优化变量的最优解,并根据所述最优解确定最优稳态概率;
[0032]确定预设稳态概率与所述最优稳态概率的大小,并在所述最优稳态概率大于所述预设稳态概率时,根据所述最优解确定过每个所述预设控制动作的第一选取概率;
[0033]根据预设权重系数和所述第一选取概率,确定每个所述预设控制动作的选取概率。
[0034]本公开第二方面提供一种预警性异常检测与风险规避的工业设备控制装置,所述装置包括:
[0035]获取模块,用于获取待控制设备在当前时刻的可控状态及预设参数的统计量状态,所述统计量状态用于表征所述待控制设备的变化状态;
[0036]第一确定模块,用于将所述可控状态及所述统计量状态输入控制动作决策模型,以最大化收益为目标,通过所述控制动作决策模型的目标函数和所述控制动作决策模型的约束条件,确定每个预设控制动作的选取概率;
[0037]第二确定模块,用于根据预设的动作选取策略和所述每个预设控制动作的所述选取概率,确定目标控制动作。
[0038]控制模块,用于根据所述目标控制动作控制所述待控制设备。
[0039]本公开第三方面提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开第一方面中任一项所述方法的步骤。
[0040]本公开第四方面提供一种电子设备,包括:
[0041]存储器,其上存储有计算机程序;
[0042]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预警性异常检测与风险规避的工业设备控制方法,其特征在于,所述方法包括:获取待控制设备在当前时刻的可控状态及预设参数的统计量状态,所述统计量状态用于表征所述待控制设备的变化状态;将所述可控状态及所述统计量状态输入控制动作决策模型,以最大化收益为目标,通过所述控制动作决策模型的目标函数和所述控制动作决策模型的约束条件,确定每个预设控制动作的选取概率;根据预设的动作选取策略和所述每个预设控制动作的所述选取概率,确定目标控制动作;根据所述目标控制动作控制所述待控制设备。2.根据权利要求1所述的方法,其特征在于,所述获取待控制设备在当前时刻的统计量状态,包括:基于预设的概率密度函数,确定第一时间段内每个时刻的所述预设参数的对数似然比,其中,所述概率密度函数包括第一概率密度函数和第二概率密度函数,所述第一概率密度函数用于表征所述预设参数的观测值位于变化点前的概率分布,所述第二概率密度函数用于表征所述预设参数的观测值位于所述变化点后的概率分布,所述变化点为所述观测值的统计平均值发生变化的时间点,所述第一时间段用于表征起始时刻至当前时刻的时间段;针对每个第二时间段,确定对数似然比累积和,所述对数似然比累积和用于表征所述第二时间段内每个时刻的所述预设参数的对数似然比的和值,所述第二时间段用于表征所述第一时间段内的每个时刻至当前时刻的时间段;将最大的对数似然比累积和确定为所述预设参数的统计量;根据所述统计量以及统计量状态与统计量之间的预设对应关系,确定所述待控制设备在当前时刻的统计量状态。3.根据权利要求1所述的方法,其特征在于,所述目标函数为:3.根据权利要求1所述的方法,其特征在于,所述目标函数为:3.根据权利要求1所述的方法,其特征在于,所述目标函数为:3.根据权利要求1所述的方法,其特征在于,所述目标函数为:其中,χ表示由统计量状态、可控状态、变化时间状态及当前时间状态构成的四元组状态,S表示由四元组状态构成的状态空间,a表示预设控制动作,A表示预设控制动作的动作状态空间,y
χ
a表示目标优化变量,R(χ,a)表示在四元组状态χ下执行预设控制动作a得到的收益,表示取四元组状态χ中当前时刻n的可控状态x
n
,x
n
表示n时刻的可控状态,a
n
表示n时刻选取的目标控制动作,R(x
n
,a
n
)表示n时刻在可控状态x
n
下执行预设控制动作a
n
得到的收益,π
χ
表示状态的稳态概率,f
a
(χ)表示预设控制动作选取函数,表示在状态χ下选取预设控制动作a的概率,d0表示预设的工业设备损坏相关参数值,x
m
表示预设的最小可控状态,x0表示预设的起始可控状态,Θ表示任意常数。
4.根据权利要求1

3中任一项所述的方法,其特征在于,所述约束条件包括状态约束条件和安全约束条件,其中,所述状态约束条件用于表征所述待控制设备所在系统达到稳态状态的...

【专利技术属性】
技术研发人员:韩宇星陈祖旭陈巍
申请(专利权)人:清华大学深圳国际研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1