多智能体系统的资源协同分配方法及装置制造方法及图纸

技术编号：27210687 阅读：38 留言：0更新日期：2021-01-31 12:46

本申请公开了一种多智能体系统的资源协同分配方法及装置，所述方法包括：为每个智能体初始化边界变量，使每个智能体开启第一迭代过程，所述第一迭代过程包括以下处理至少之一：进行第一邻居间的交互协调、进行更新边界变量；所述第一迭代过程完成后，将每个智能体将上边界变量和下边界变量固定为定值；使每个智能体开启第二迭代过程，所述第二迭代过程包括以下处理至少之一：监视本地资源并更新状态标志、计算本地效能对本地资源偏导数、进行第二邻居间的交互协调、更新本地资源；确定所述第二迭代过程完成，确定资源分配效果满足系统总体效能最大化的目标。本申请无需智能体具有全局通信能力，依靠邻居节点的分布式交互即可实现最优资源分配。实现最优资源分配。实现最优资源分配。

全部详细技术资料下载

【技术实现步骤摘要】
多智能体系统的资源协同分配方法及装置

[0001]本申请实施例涉及信号处理技术，尤其涉及一种多智能体系统的资源协同分配方法及装置。

技术介绍

[0002]智能体泛指具有智能的自主体，通常具有计算能力、通信能力、响应能力等功能，常见的智能体包括人造卫星、无人机、无人车、智能电器、智能硬件、机电一体化传感器、货物仓储、发电机等。多个智能体组成的多智能体系统协同工作可以实现更复杂的任务功能。例如，多个传感器协同工作形成的无线传感器网络可以实现区域监测覆盖，多个小孔径相机协同工作形成的合成孔径相机可以实现等效大口径观测，多个发电机协同工作形成的发电机组可以实现大功率电能输出。
[0003]多智能体系统的协同工作过程通常伴随着资源的流动及分配。由于每个智能体不完全相同，甚至可能性能差异相当巨大，即在给予相同资源的条件下，每个智能体所产生的本地效能是有高有低的。因此，多智能体系统实际应用中需要解决资源协同分配问题，即解决如何将总量一定的资源合理地分配给多智能体系统的每个智能体，从而使系统总体效能实现最大化的问题。
[0004]遗憾的是，由于多智能体的资源分配尚属前沿技术，并无相关技术可供参考。

技术实现思路

[0005]有鉴于此，本申请实施例提供一种多智能体系统的资源协同分配方法及装置。
[0006]根据本申请的第一方面，提供一种多智能体系统的资源协同分配方法，包括：
[0007]为每个智能体初始化边界变量，边界变量至少包括上边界变量α
i
和下边界变量β
...

【技术保护点】

【技术特征摘要】
1.一种多智能体系统的资源协同分配方法，其特征在于，所述方法包括：为每个智能体初始化边界变量，边界变量至少包括上边界变量α
i
和下边界变量β
i
，其中，i为智能体的编号，α
i
和β
i
均为实数；在第t＝0时刻，上边界变量α
i
初始化为下边界变量β
i
初始化为其中，[0]代表变量在t＝0时刻的取值，x
i
代表智能体i的本地资源，其取值范围为a
i
≤x
i
≤b
i
，a
i
和b
i
分别是资源x
i
允许的下限和上限；u
i
代表智能体i关于本地资源x
i
的效能函数即u
i
＝u
i
(x
i
)，代表效能函数u
i
对资源x
i
的偏导数，和分别代表竖线左侧变量在x
i
＝a
i
和x
i
＝b
i
的值；使每个智能体开启第一迭代过程，所述第一迭代过程包括以下处理至少之一：进行第一邻居间的交互协调、进行更新边界变量；比较当前时刻k和系统中所有智能体的数量n的大小，若k+1<n，则所述第一迭代过程完成；否则重复所述第一迭代过程；所述第一迭代过程完成后，将每个智能体将上边界变量和下边界变量固定为定值，并分别记为α
i
[CONST]和β
i
[CONST]；对每个智能体，重置时刻标签令k＝0，根据输入条件初始化本地资源x
i
，即令x
i
[0]等于输入条件中智能体i初始资源的数值；使每个智能体开启第二迭代过程，所述第二迭代过程包括以下处理至少之一：监视本地资源并更新状态标志、计算本地效能对本地资源偏导数、进行第二邻居间的交互协调、更新本地资源；比较当前时刻k和预设迭代最大次数m的大小，m为正整数且满足若k+1<m，则所述第二迭代过程完成，此时资源分配效果满足系统总体效能最大化的目标；否则重复所述第二迭代过程；其中，所述系统总体效能最大化是指：其中的限制条件为：每个智能体i的本地资源满足a
i
≤x
i
≤b
i
，且所有智能体资源总量恒定，即其中D为实数型常数，D的值由所有智能体初始资源的总和决定，即2.根据权利要求1所述的方法，其特征在于，所述效能函数u
i
是智能体i用来刻画本地资源x
i
与本地效能对应关系的连续函数，u
i
满足二阶可导且二阶导数为负数，即对于任意的i成立，对任意非本地资源x
j
的偏导数等于0，即对于任意的i≠j成立；u
i
、x
i
、x
j
、a
i
、b
i
取值范围均为实数。3.根据权利要求2所述的方法，其特征在于，所述进行邻居间的交互协调，包括：在第t＝k时刻，每个智能体i向邻居智能体广播发送边界变量α
i
[k]和β
i
[k]，并接收所有邻居智能体发送的边界变量，其中，[k]代表变量在t＝k时刻的取值，k为非负整数，邻居
智能体指的是能够与当前智能体进行信息交互的智能体；所述更新边界变量，包括：在第t＝k+1时刻，每个智能体按下式(1)和式(2)更新边界变量：α
i
[k+1]＝max{α
p
[k]|p∈N
i
∪{i}}
ꢀꢀꢀꢀꢀꢀꢀꢀ
(1)β
i
[k+1]＝min{β
p
[k]|p∈N
i
∪{i}}
ꢀꢀꢀꢀꢀ
(2)其中，N
i
代表智能体i的邻居智能体集合，N
i
∪{i}代表由智能体i和它所有邻居智能体组成的并集集合，集合{α
p
[k]|p∈N
i
∪{i}}代表由智能体i和它所有邻居智能体的上边界变量组成的集合，集合{β
p
[k]|p∈N
i
∪{i}}代表由智能体i和它所有邻居智能体的下边界变量组成的集合，min和max分别表示求取集合中的最小值和最大值。4.根据权利要求3所述的方法，其特征在于，所述监视本地资源并更新状态标志，包括：在第t＝k时刻，每个智能体i监视本地资源变量x
i
，并按下式(3)和式(4)更新状态标志σ
i
和τ
i
：：其中，σ
i
为饥饿状态标志，τ
i
为饱和状态标志；所述计算本地效能对本地资源偏导数，包括：在第t＝k时刻，对每个智能体i计算本地效能对本地资源偏导数得到5.根据权利要求4所述的方法，其特征在于，所述进行第二邻居间的交互协调，包括：在第t＝k时刻，每个智能体i向邻居智能体广播发送状态标志和本地效能对本地资源偏导数，即σ
i
[k]、τ
i
[k]、并接收所有邻居智能体发送的状态标志和本地效能对本地资源偏导数；所述更新本地资源，包括：在第t＝k+1时刻，每个智能体按下式(5)更新本地资源：其中，ε为代表所述第二迭代过程的迭代步长的常数，取值为n是系统中所有智能体的数量；A
i
、B
i
、C
i
均为实数，每个时刻分别按下式(6)、(7)、(8)计算得到：A
i
[k]＝ρ
i
[k]
·
(1-τ
i
[k])
·
α
i
[CONST]
ꢀꢀꢀꢀꢀꢀꢀꢀ
(6)C
i
[k]＝τ
i
[k]
·
β
i
[CONST]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)。6.一种多智能...

【专利技术属性】
技术研发人员：王晓初，周庆瑞，孙昌浩，邱华鑫，冯宇婷，
申请(专利权)人：中国空间技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人