【技术实现步骤摘要】
本申请涉及无线通信网络,特别是涉及一种基于语义信息预测的多智能体通信协作方法、装置及设备。
技术介绍
1、多智能体深度强化学习mdrl是解决信息协调策略问题的有效方法,主要优势在于它可以将强化学习扩展到高维的状态和动作空间。深度强化学习在许多需要感知高维度原始输入数据和决策控制的任务中,已经取得了实质性的突破,例如无人驾驶、机器人控制、交通运输调度、通信网络、以及金融和社会学等领域。
2、在多智能体中,每个智能体分布于环境中,只能获得局部观察无法获取环境整体状态,导致智能体部分可观察挑战。同时面临非平稳问题,通信被认为是多智能体一种重要手段。尽管智能体接收到的观测值经常变化,但连续的观测中呈现的信息通常是相似的,智能体之间的消息交换往往冗余且海量。直接进行通信将对现有通信系统造成极大挑战,将耗费了大量通信资源。需要考虑传输信息量和通信带宽,不仅考虑利用通信提高整体性能,同时关注数据量和频带资源的消耗。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高通信整体性
...【技术保护点】
1.一种基于语义信息预测的多智能体通信协作方法,其特征在于,所述方法实施于相互通信的多个智能体中,所述方法包括:
2.根据权利要求1所述的多智能体通信协作方法,其特征在于,所述根据当前时刻的局部观测数据以及全局观测数据得到全局动作值函数包括:
3.一种基于语义信息预测的多智能体通信协作方法,其特征在于,所述方法实施于相互通信的多个智能体中,所述方法包括:
4.根据权利要求3所述的多智能体通信协作方法,其特征在于,所述动作预测提示词以及语义提示词根据任务信息、规则信息以及延时信息进行构建。
5.一种基于语义信息预测的多智能
...【技术特征摘要】
1.一种基于语义信息预测的多智能体通信协作方法,其特征在于,所述方法实施于相互通信的多个智能体中,所述方法包括:
2.根据权利要求1所述的多智能体通信协作方法,其特征在于,所述根据当前时刻的局部观测数据以及全局观测数据得到全局动作值函数包括:
3.一种基于语义信息预测的多智能体通信协作方法,其特征在于,所述方法实施于相互通信的多个智能体中,所述方法包括:
4.根据权利要求3所述的多智能体通信协作方法,其特征在于,所述动作预测提示词以及语义提示词根据任务信息、规则信息以及延时信息进行构建。
5.一种基于语义信息预测的多智能体通信协作方法,其特征在于...
【专利技术属性】
技术研发人员:周力,邓新锋,张姣,王海军,刘潇然,张亦弛,赵海涛,魏急波,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。