一种面向工业互联网的博弈控制系统鲁棒策略求解方法技术方案

技术编号：36711564 阅读：30 留言：0更新日期：2023-03-01 09:39

本发明专利技术公开了一种面向工业互联网的博弈控制系统鲁棒策略求解方法，包括步骤：根据工业互联网实际背景将系统建模为博弈控制系统，在此基础上引入扰动决策者，确定包含扰动的系统状态方程与各博弈参与者包含扰动决策的代价函数；根据各博弈参与者包含扰动决策的的代价函数，定义系统各博弈参与者在时刻k的累积代价函数；根据包含扰动的系统状态方程以及各博弈参与者在时刻k的累积代价函数，迭代求解各时刻的最优反馈均衡策略与针对各博弈参与者的最优干扰策略。该方法在保证系统稳定性的前提下，能够在内外扰动、随机噪声等因素导致系统状态方程发生参数摄动的情况下，仍然保持预期的标称控制性能，提高系统鲁棒性。提高系统鲁棒性。提高系统鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向工业互联网的博弈控制系统鲁棒策略求解方法

[0001]本专利技术涉及工业互联网领域，具体涉及一种面向工业互联网的博弈控制系统鲁棒策略求解方法。

技术介绍

[0002]工业互联网旨在实现生产全要素、全产业链和全价值链的网络化协同，涉及信息建模、数据安全与生产管控、网络化协同与自主决策。加快发展工业互联网已成为各国抢占全球产业竞争制高点与重塑工业体系的共同选择。
[0003]在工业互联网制造流程、资源调配、通信网络等各类复杂系统中，个体行为不仅受客观物理规律限制，而且受主观利益或目标驱动，控制理论与博弈理论均无法单独实现对此类系统的调控。同时，由于系统中个体的“逐利性”，即每个个体均追求自身利益最大化/代价最小化，系统也需要“调控者”通过决策影响个体行为，进而对系统整体利益进行维护。博弈控制系统为此类系统建模提供了一种可行方法。博弈控制系统由代表系统整体利益的顶层博弈参与者以及代表个体利益的底层博弈参与者共同构成，各博弈参与者的决策作为系统的控制输入，共同影响系统状态。
[0004]博弈控制系统提供了将工...

【技术保护点】

【技术特征摘要】
1.一种面向工业互联网的博弈控制系统鲁棒策略求解方法，其特征在于，包括以下步骤：步骤一、根据工业互联网实际背景将系统建模为博弈控制系统，在此基础上引入扰动决策者，确定包含扰动的系统状态方程与各博弈参与者包含扰动决策的代价函数；步骤二、根据各博弈参与者包含扰动决策的代价函数，定义系统各博弈参与者在时刻k的累积代价函数；步骤三、根据包含扰动的系统状态方程以及各博弈参与者在时刻k的累积代价函数，迭代求解各时刻的最优反馈均衡策略与针对各博弈参与者的最优干扰策略。2.根据权利要求1所述的面向工业互联网的博弈控制系统鲁棒策略求解方法，其特征在于，所述步骤一中，引入扰动决策者后的博弈控制系统包括m+n+1个博弈参与者，其中包含m个领导者，n个跟随者，以及一个由不确定性抽象为的扰动决策者；领导者与跟随者做出决策，期望最优化自身的性能指标；而扰动决策者作出决策，期望使其它博弈参与者性能指标最坏；当系统达到均衡时，任何博弈参与者单方面改变决策都不能使自身性能指标更优，此时领导者与跟随者采纳的策略即为鲁棒策略；博弈参与者以反馈信息结构进行N步决策，每个博弈参与者的决策均通过系统状态空间影响各博弈参与者的代价函数，同时系统状态受到扰动w
k
影响。3.根据权利要求2所述的面向工业互联网的博弈控制系统鲁棒策略求解方法，其特征在于，所述步骤一中，所述包含扰动的系统状态方程由如下差分方程描述：其中表示系统状态，为第i个领导者的决策，为第j个跟随者的决策，为影响系统的实际扰动，表示时刻，A为描述系统当前时刻状态与下一时刻状态更新关系的给定矩阵，为描述第i个领导者决策对下一时刻系统状态影响关系的给定矩阵，为描述第j个跟随者决策对下一时刻系统状态影响关系的给定矩阵，D为描述扰动对系统状态影响关系的给定矩阵。4.根据权利要求3所述的面向工业互联网的博弈控制系统鲁棒策略求解方法，其特征在于，所述步骤一中，所述各博弈参与者包含扰动决策的代价函数为在于，所述步骤一中，所述各博弈参与者包含扰动决策的代价函数为其中权重矩阵以及终止时刻权重矩阵为给定的非
负定矩阵，为给定...

【专利技术属性】
技术研发人员：高庆，蔡鑫江，吕金虎，刘昊，王振乾，王薇，
申请(专利权)人：北京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人