【技术实现步骤摘要】
预警性异常检测与风险规避的工业设备控制方法及装置
[0001]本公开涉及工业设备
,具体地,涉及一种预警性异常检测与风险规避的工业设备控制方法及装置。
技术介绍
[0002]相关技术中,为了实现对工业设备的控制,多根据工业设备的运行状态构建马尔可夫决策模型(Markov Decision Process,MDP),并基于最快变化检测(Quickest Change Detection,QCD)的视角来处理MDP模型变化的最优控制问题。然而,相关技术中虽然运用了QCD来研究MDP的变化问题,但仅关注于在不同MDP的最佳策略切换控制,并未实现自适应实时输出控制策略,难以应用于工业报警环境中。
技术实现思路
[0003]本公开的目的是提供一种预警性异常检测与风险规避的工业设备控制方法及装置,以解决上述技术问题。
[0004]为了实现上述目的,本公开第一方面提供一种预警性异常检测与风险规避的工业设备控制方法,所述方法包括:
[0005]获取待控制设备在当前时刻的可控状态及预设参数的统计量状态,所述统计量状态用于表征所述待控制设备的变化状态;
[0006]将所述可控状态及所述统计量状态输入控制动作决策模型,以最大化收益为目标,通过所述控制动作决策模型的目标函数和所述控制动作决策模型的约束条件,确定每个预设控制动作的选取概率;
[0007]根据预设的动作选取策略和所述每个预设控制动作的所述选取概率,确定目标控制动作;
[0008]根据所述目标控制动作控制所述待控制设备 ...
【技术保护点】
【技术特征摘要】
1.一种预警性异常检测与风险规避的工业设备控制方法,其特征在于,所述方法包括:获取待控制设备在当前时刻的可控状态及预设参数的统计量状态,所述统计量状态用于表征所述待控制设备的变化状态;将所述可控状态及所述统计量状态输入控制动作决策模型,以最大化收益为目标,通过所述控制动作决策模型的目标函数和所述控制动作决策模型的约束条件,确定每个预设控制动作的选取概率;根据预设的动作选取策略和所述每个预设控制动作的所述选取概率,确定目标控制动作;根据所述目标控制动作控制所述待控制设备。2.根据权利要求1所述的方法,其特征在于,所述获取待控制设备在当前时刻的统计量状态,包括:基于预设的概率密度函数,确定第一时间段内每个时刻的所述预设参数的对数似然比,其中,所述概率密度函数包括第一概率密度函数和第二概率密度函数,所述第一概率密度函数用于表征所述预设参数的观测值位于变化点前的概率分布,所述第二概率密度函数用于表征所述预设参数的观测值位于所述变化点后的概率分布,所述变化点为所述观测值的统计平均值发生变化的时间点,所述第一时间段用于表征起始时刻至当前时刻的时间段;针对每个第二时间段,确定对数似然比累积和,所述对数似然比累积和用于表征所述第二时间段内每个时刻的所述预设参数的对数似然比的和值,所述第二时间段用于表征所述第一时间段内的每个时刻至当前时刻的时间段;将最大的对数似然比累积和确定为所述预设参数的统计量;根据所述统计量以及统计量状态与统计量之间的预设对应关系,确定所述待控制设备在当前时刻的统计量状态。3.根据权利要求1所述的方法,其特征在于,所述目标函数为:3.根据权利要求1所述的方法,其特征在于,所述目标函数为:3.根据权利要求1所述的方法,其特征在于,所述目标函数为:3.根据权利要求1所述的方法,其特征在于,所述目标函数为:其中,χ表示由统计量状态、可控状态、变化时间状态及当前时间状态构成的四元组状态,S表示由四元组状态构成的状态空间,a表示预设控制动作,A表示预设控制动作的动作状态空间,y
χ
a表示目标优化变量,R(χ,a)表示在四元组状态χ下执行预设控制动作a得到的收益,表示取四元组状态χ中当前时刻n的可控状态x
n
,x
n
表示n时刻的可控状态,a
n
表示n时刻选取的目标控制动作,R(x
n
,a
n
)表示n时刻在可控状态x
n
下执行预设控制动作a
n
得到的收益,π
χ
表示状态的稳态概率,f
a
(χ)表示预设控制动作选取函数,表示在状态χ下选取预设控制动作a的概率,d0表示预设的工业设备损坏相关参数值,x
m
表示预设的最小可控状态,x0表示预设的起始可控状态,Θ表示任意常数。
4.根据权利要求1
‑
3中任一项所述的方法,其特征在于,所述约束条件包括状态约束条件和安全约束条件,其中,所述状态约束条件用于表征所述待控制设备所在系统达到稳态状态的...
【专利技术属性】
技术研发人员:韩宇星,陈祖旭,陈巍,
申请(专利权)人:清华大学深圳国际研究生院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。