一种任务关键型控制系统的最优控制感知传输方法技术方案

技术编号:36960158 阅读:15 留言:0更新日期:2023-03-22 19:20
本申请提供一种任务关键型控制系统的最优控制感知传输方法,该方法包括:确定每个时隙中的系统状态;在每个时隙中,在观测所述系统状态之后,根据特定的决策规则进行动作;根据所述系统状态和动作,确定所述任务关键型控制系统中每阶段成本函数,所述每阶段成本函数作为误差估计协方差的轨迹;确定一个最优的传输策略,以使得所述误差估计协方差的轨迹最小化,同时满足蜂窝使用预算和系统稳定性约束。该方案综合考虑了带宽成本、状态估计精度和系统稳定性。统稳定性。统稳定性。

【技术实现步骤摘要】
一种任务关键型控制系统的最优控制感知传输方法


[0001]本专利技术属于通信
,特别涉及一种任务关键型控制系统的最优控制感知传输方法。

技术介绍

[0002]随着物联网(IoT)的发展及长期演进和未来第五代(5G)移动通信技术的发展,机器对机器(M2M)通信最近引起了学术界和业界的广泛关注。M2M通信可以分为两种方式:海量M2M(mM2M)和超可靠、超低延迟的M2M(uM2M)。无线连接大量低功耗和低复杂度的机器类设备是mM2M通信。示例包括智能计量、远程诊断、体表传感、智能农业和监控系统。另一方面,uM2M是为对可用性、延迟和可靠性有非常严格要求的网络服务提供足够的无线连接。工业控制、智能设备、远程手术和自动驾驶汽车是uM2M通信的一些例子,涉及实时控制和触觉反馈。关键任务控制系统(又称为任务关键型控制系统)属于uM2M通信的范畴。
[0003]一般来说,关键任务控制系统是一个反馈控制回路,它涉及到设备状态信息通过无线网络在带有嵌入式传感器的移动设备(MD)和装有驱动装置的遥控器之间进行通信。在这个闭环中,一个关键的问题是,估计设备状态的错误代价与从MD向远程控制器传输设备状态信息的代价混合在一起。显然,MD传递的信息越多,遥控器得到的估计就越准确。但这导致了对带宽的需求不断增加,而在实际应用中,带宽通常是有限的,而且是收费的。

技术实现思路

[0004]本说明书实施例的目的是提供一种任务关键型控制系统的最优控制感知传输方法。
[0005]为解决上述技术问题,本申请实施例通过以下方式实现的:
[0006]本申请提供一种任务关键型控制系统的最优控制感知传输方法,所述任务关键型控制系统包括待控制的动态设备、在有限位置移动的移动设备、控制决策的远程控制器以及无线通信模型,该方法包括:
[0007]确定每个时隙中的系统状态;
[0008]在每个时隙中,在观测所述系统状态之后,根据特定的决策规则进行动作;
[0009]根据所述系统状态和动作,确定所述任务关键型控制系统中每阶段成本函数,所述每阶段成本函数作为误差估计协方差的轨迹;
[0010]确定一个最优的传输策略,以使得所述误差估计协方差的轨迹最小化,同时满足蜂窝使用预算和系统稳定性约束。
[0011]在其中一个实施例中,每个时隙中的系统状态用二元组表示,每个时隙中的系统状态用二元组表示,其中V
t
表示控制器中远程估计的估计误差协方差,L
t
是当前位置,和分别是估计误差协方差和位置的状态空间。
[0012]在其中一个实施例中,在每个时隙中,在观测所述系统状态之后,根据特定的决策规则进行动作α
t
,包括:
[0013]让指定移动设备在每个时隙中的传输决定,其中α
t
=0表示移动设备保持空闲,α
t
=1表示移动设备决定通过蜂窝基站发送状态估计,α
t
=2表示移动设备在wifi可用时wifi发送状态估计;
[0014]其中是移动设备位置为l时的可用操作集:
[0015][0016]在其中一个实施例中,根据所述系统状态和动作,确定所述任务关键型控制系统中每阶段成本函数为:
[0017][0018]其中,V
t
为估计误差协方差,动态表示为:
[0019][0020]其中,x
t
为动态设备的状态,为状态x
t
的最小均方误差估计,G
t
为所述远程控制器侧的信息集。
[0021]在其中一个实施例中,确定一个最优的传输策略,以使得所述误差估计协方差的轨迹最小化,同时满足蜂窝使用预算和系统稳定性约束,转化为CMDP:
[0022][0023][0024][0025]其中,σ>0是平均蜂窝成本预算,取决于预定分配;和是给定策略η∈Π的平均预期估计误差协方差和平均蜂窝成本,其中初始状态为θ0∈Ω,是蜂窝连接成本,其中F
c
是每次蜂窝连接产生的成本。
[0026]在其中一个实施例中,如果σ接近零,并且wifi仅在有限的位置可用,则控制器无法确保稳定性,因此重新分析问题将其等价为
[0027][0028][0029]在其中一个实施例中,引入了拉格朗日乘子将CMDP转化为参数化的无约束MDP;对
于任何拉格朗日乘子μ,将时隙t中的瞬时拉格朗日代价定义如下:
[0030]d(Θ
t
,a
t
;μ)=d(Θ
t
,a
t
)+μj
c
(a
t
)
[0031]定义策略π的拉格朗日平均成本,如下所示:
[0032][0033]因此,对于给定的拉格朗日乘子μ,相应的无约束MDP如下所示:
[0034][0035]在其中一个实施例中,无约束MDP最优策略的阈值结构为:
[0036]根据拉格朗日平均成本,定义与折扣因子ζ∈(0,1)和静态策略π相关的折现拉格朗日代价为:
[0037][0038]相应的贴现成本MDP为:
[0039][0040]折扣成本最优策略的阈值结构为:
[0041]对于给定的μ>0和一个折现因子0<ζ<1,对于贴现成本MDP的优化策略是确定的,并具有如下结构:
[0042]当wifi不可用时,即
[0043][0044]当wifi可用时,即
[0045][0046]其中v
*

t
;μ)是同时取决于系统状态和拉格朗日乘子μ的阈值;
[0047]无约束MDP的最优策略继承了折扣成本最优策略的结构,所以无约束MDP的最优策略结构为:
[0048]对于给定的μ>0,无约束MDP的优化策略π
*
(μ)是确定的,并具有如下结构:
[0049]当wifi不可用时,即
[0050][0051]当wifi可用时,即
[0052][0053]其中v
*

t
;μ)是同时取决于系统状态和拉格朗日乘子μ的阈值。
[0054]在其中一个实施例中,约束MDP问题的最优策略结构为:
[0055]CMDP问题的最佳解决方案是一种平稳传输策略π
*
它是阈值传输策略的随机混合,如下所示:
[0056]当wifi不可用时,即
[0057][0058]当wifi可用时,即
[0059][0060]其中0≤m
u
≤1,0≤m
a
≤1,和是静止无约束MDP,对应的拉格朗日乘子分别为μ1、μ2、μ3和μ4。
[0061]由以上本说明书实施例提供的技术方案可见,该方案:综合考虑了带宽成本、状态估计精度和系统稳定性。
附图说明
[0062]为了更清楚地说明本说明书实施例或现有技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种任务关键型控制系统的最优控制感知传输方法,所述任务关键型控制系统包括待控制的动态设备、在有限位置移动的移动设备、控制决策的远程控制器以及无线通信模型,其特征在于,所述方法包括:确定每个时隙中的系统状态;在每个时隙中,在观测所述系统状态之后,根据特定的决策规则进行动作;根据所述系统状态和动作,确定所述任务关键型控制系统中每阶段成本函数,所述每阶段成本函数作为误差估计协方差的轨迹;确定一个最优的传输策略,以使得所述误差估计协方差的轨迹最小化,同时满足蜂窝使用预算和系统稳定性约束。2.根据权利要求1所述的方法,其特征在于,所述每个时隙中的系统状态用二元组表示,其中V
t
表示控制器中远程估计的估计误差协方差,L
t
是当前位置,和分别是估计误差协方差和位置的状态空间。3.根据权利要求1所述的方法,其特征在于,所述在每个时隙中,在观测所述系统状态之后,根据特定的决策规则进行动作α
t
,包括:让指定移动设备在每个时隙中的传输决定,其中α
t
=0表示移动设备保持空闲,α
t
=1表示移动设备决定通过蜂窝基站发送状态估计,α
t
=2表示移动设备在wifi可用时wifi发送状态估计;其中是移动设备位置为l时的可用操作集:4.根据权利要求1所述的方法,其特征在于,所述根据所述系统状态和动作,确定所述任务关键型控制系统中每阶段成本函数为:其中,V
t
为估计误差协方差,动态表示为:其中,x
t
为动态设备的状态,为状态x
t
的最小均方误差估计,G
t
为所述远程控制器侧的信息集。5.根据权利要求1所述的方法,其特征在于,所述确定一个最优的传输策略,以使得所述误差估计协方差的轨迹最小化,同时满足蜂窝使用预算和系统稳定性约束,转化为CMDP:转化为CMDP:
其中,σ>0是平均蜂窝成本预算,取决于预定分配;ν
η
和是给定策略η∈Π的平均预期估计误差协方差和平均蜂窝成本,其中初始状态为θ0∈Ω,是蜂窝连接成本,其中F
c
是每次蜂窝连...

【专利技术属性】
技术研发人员:武艳梁欢杨清海乔飞宇
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1