【技术实现步骤摘要】
协同执行多种任务的在线稀疏群智感知方法
[0001]本专利技术涉及多任务稀疏群智感知的模型在线更新
、
数据推断
、
预算分配和任务协同调度,特别涉及一种基于分层多智能体强化学习的数据收集方法,用于实现协同执行多种任务的在线稀疏群智感知
。
技术介绍
[0002]稀疏群智感知需要招募参与者从少部分感知区域中收集数据,推断剩余未感知区域的数据,这可以降低数据收集的成本
。
现有技术此先的工作一般只考虑单种数据的独立收集和推断,然而在现实世界的场景中,可能存在多种可以相互补充时空信息的数据
。
因此现有的方案存在对数据信息利用不足的问题
。
技术实现思路
[0003]针对现有技术存在的缺陷和不足,本专利技术充分考虑多种数据之间的相关性,协同执行多种具有相关性的稀疏群智感知任务,从而进一步降低感知成本,提高数据推断质量
。
此外,为了更加贴近稀疏群智感知的现实应用场景,本专利技术在仅有少量稀疏历史数据的情况下,使用实时收 ...
【技术保护点】
【技术特征摘要】
1.
一种协同执行多种任务的在线稀疏群智感知方法,其特征在于,包括以下步骤:步骤
S1
:通过随机收集若干周期的真实数据冷启动;步骤
S2
:基于最新收集到的真实感知数据,计算数据变化趋势更新训练数据;步骤
S3
:使用最新的训练数据更新数据推断和数据收集模型参数;步骤
S4
:预算分配智能体将总预算分配至每种感知任务;步骤
S5
:多个智能体协同收集不同感知任务数据;步骤
S6
:判断是否所有任务耗尽预算,判断为是则前往步骤
S7
,否则继续步骤
S5
;步骤
S7
:利用多种任务数据相关性,联合推断其他未收集区域的数据;步骤
S8
:进入下一周期的循环,返回步骤
S2。2.
根据权利要求1所述的协同执行多种任务的在线稀疏群智感知方法,其特征在于:步骤
S1
的具体操作过程为:步骤
S101
:将完整目标感知区域利用网格法划分,划分为
m
个子区域;步骤
S102
:平均将预算分配至每种感知任务,每个数据收集智能体负责一种任务数据的收集,随机调度智能体收集不同子区的感知数据;步骤
S103
:将感知到的数据返回调度中心,直至冷启动周期结束
。3.
根据权利要求1所述的协同执行多种任务的在线稀疏群智感知方法,其特征在于:步骤
S2
中基于最新收集到的真实感知数据,计算数据变化趋势更新训练数据的操作过程为:步骤
S201
:从所有感知任务中依次取出每种任务,计算上一周期训练数据的均值
,
其中
TD
k
表示第
k
种任务数据的训练数据:
avg(TD
k
[:,
‑
1])
步骤
S202
:计算当前周期真实收集到的数据均值,其中
SparseGTD
k
中存放的是第
k
种任务真实收集到的数据:
avg(SparseGTD
k
[:,
‑
1])
步骤
S203
:更新训练数据中未收集到的子区域数据,当其他任务未收集该子区域
i
的数据时,用以下公式更新该子区域的训练数据:步骤
S204
:当其他任务收集到子区域
i
的数据时,结合其他相关性数据的变化趋势,用以下公式更新该子区域的训练数据
。
其中
λ
t
和分别表示渐变性和相似性权重,且分别表示渐变性和相似性权重,且步骤
S205
:对所有感知任务重复执行步骤
S201
至步骤
S204
,直至训练数据更新完毕
。4.
根据权利要求3所述的协同执行多种任务的在线稀疏群智感知方法,其特征在于:步骤
S3
中使用最新的训练数据更新数据推断和数据收集模型参数的操作过程为:
步骤
S301
:使用步骤
S2
更新的训练集训练数据推断网络;步骤
S302
:使用步骤
S2
更新的训练集训练数据收集智能体中的预算分配智能体,参数更新公式为强化学习
DQN
算法更新公式,如下所示;其中是预算分配智能体每次探索获得的奖励,和分别为当前状态和下一状态,
budget
k
为任务
k
获得的预算,
γ
为强化学习衰减因子:步骤
S303
:训练数据收集智能体中的区域选择智能体,参数更新公式为多智能体强化学习
QMIX
算法更新公式,如下所示;区域选择智能体的数量与感知任务数量相等,每个区域选择智能体负责收集一种感知任务数据:其中为所有智能体获得的奖励,
o
k,t
为每个智能体的局部观测状态,和分别为当前全局状态和下一全局状态
。5.
根据权利要求4所述的协同执行多种任务的在线稀疏群智感知方法,其特征在于:步骤
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。