基于语义信息预测的多智能体通信协作方法、装置及设备制造方法及图纸

技术编号:42472083 阅读:24 留言:0更新日期:2024-08-21 12:56
本申请涉及一种基于语义信息预测的多智能体通信协作方法、装置及设备,通过对其他智能体发送的观察数据进行信道解码得到其他各智能体采用语义大模型根据各自当前时刻的局部观测数据预测得到的下一时刻的局部预测动作以及语义特征信息,根据所有其他智能体的局部预测动作以及语义特征信息进行信息重构,得到全局语义观测数据,利用语义反对齐网络将全局语义观测数据映射至观察状态域,得到对应的全局观测数据,根据当前时刻的局部观测数据以及全局观测数据得到全局动作值函数,将全局动作值函数输入强化学习网络中得到下一时刻的决策。采用本方法可以减少多智能体通信时的大量冗余信息,从而提高收敛速度和精度的情况下显著降低智能体间通信开销。

【技术实现步骤摘要】

本申请涉及无线通信网络,特别是涉及一种基于语义信息预测的多智能体通信协作方法、装置及设备


技术介绍

1、多智能体深度强化学习mdrl是解决信息协调策略问题的有效方法,主要优势在于它可以将强化学习扩展到高维的状态和动作空间。深度强化学习在许多需要感知高维度原始输入数据和决策控制的任务中,已经取得了实质性的突破,例如无人驾驶、机器人控制、交通运输调度、通信网络、以及金融和社会学等领域。

2、在多智能体中,每个智能体分布于环境中,只能获得局部观察无法获取环境整体状态,导致智能体部分可观察挑战。同时面临非平稳问题,通信被认为是多智能体一种重要手段。尽管智能体接收到的观测值经常变化,但连续的观测中呈现的信息通常是相似的,智能体之间的消息交换往往冗余且海量。直接进行通信将对现有通信系统造成极大挑战,将耗费了大量通信资源。需要考虑传输信息量和通信带宽,不仅考虑利用通信提高整体性能,同时关注数据量和频带资源的消耗。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高通信整体性能的基于语义信息预测本文档来自技高网...

【技术保护点】

1.一种基于语义信息预测的多智能体通信协作方法,其特征在于,所述方法实施于相互通信的多个智能体中,所述方法包括:

2.根据权利要求1所述的多智能体通信协作方法,其特征在于,所述根据当前时刻的局部观测数据以及全局观测数据得到全局动作值函数包括:

3.一种基于语义信息预测的多智能体通信协作方法,其特征在于,所述方法实施于相互通信的多个智能体中,所述方法包括:

4.根据权利要求3所述的多智能体通信协作方法,其特征在于,所述动作预测提示词以及语义提示词根据任务信息、规则信息以及延时信息进行构建。

5.一种基于语义信息预测的多智能体通信协作方法,其特...

【技术特征摘要】

1.一种基于语义信息预测的多智能体通信协作方法,其特征在于,所述方法实施于相互通信的多个智能体中,所述方法包括:

2.根据权利要求1所述的多智能体通信协作方法,其特征在于,所述根据当前时刻的局部观测数据以及全局观测数据得到全局动作值函数包括:

3.一种基于语义信息预测的多智能体通信协作方法,其特征在于,所述方法实施于相互通信的多个智能体中,所述方法包括:

4.根据权利要求3所述的多智能体通信协作方法,其特征在于,所述动作预测提示词以及语义提示词根据任务信息、规则信息以及延时信息进行构建。

5.一种基于语义信息预测的多智能体通信协作方法,其特征在于...

【专利技术属性】
技术研发人员:周力邓新锋张姣王海军刘潇然张亦弛赵海涛魏急波
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1