面向水下攻防快速对手建模的交互策略优化方法技术

技术编号：39500465 阅读：11 留言：0更新日期：2023-11-24 11:30

本发明专利技术属于人工智能技术领域，涉及一种面向水下攻防快速对手建模的交互策略优化方法

全部详细技术资料下载

【技术实现步骤摘要】
面向水下攻防快速对手建模的交互策略优化方法

[0001]本专利技术属于人工智能
，具体涉及一种面向水下攻防快速对手建模的交互策略优化方法
。

技术介绍

[0002]水下战场向无人化
、
智能化发展，对水下作战攻防对抗的智能化提出要求
。
将双方参与对抗的
UUV、
鱼雷
、
潜艇等抽象为智能体，在智能体攻防对抗时，对对手智能体的策略进行建模和估计，有助于利用对手智能体的弱点取胜，称为“对手建模”。
现有对手建模方法包括策略重构
、
模式匹配
、
意图识别
、
在线学习等，在不同粒度上实现了对未知对手智能体的建模
。
[0003]在准确建模的前提下，对手建模的过程越快速，越能够优先建立水下攻防对抗优势
。
为此，部分研究针对快速对手建模展开，如论文
《
基于迁移学习的高效深度多智能体强化学习算法研究
》
提出了基于层次推理和贝叶斯策略重用技术的高效对手建模算法，达到了快速对手建模的效果
。
但是，新算法只是实现快速对手建模的一方面；无论采用何种对手建模的算法，由于对手建模的基础是与对手交互产生的数据，因而，能否实现快速对手建模还取决于是否能够选取合适的与对手交互的策略，以快速获取建模所需的数据
。
然而，这方面的相关理论与方法研究鲜见，因而目前对手建模有效数据获取效率较低，对手建模速度还有待进...

【技术保护点】

【技术特征摘要】
1.
面向水下攻防快速对手建模的交互策略优化方法，其特征在于，包括以下步骤：
S1、
确定对手智能体的类型集合，；确定我方智能体的交互策略集合，；确定我方智能体对对手智能体状态的可能观测结果集合，；
S2、
确定对手智能体各类型的置信概率，，其中，；确定在对手智能体各类型和我方智能体采取的各交互策略下，我方智能体对对手智能体状态的可能观测结果的生成概率，，，其中，；；
S3、
根据式
(1)
‑
式
(2)
，计算不同交互策略下，对手智能体策略偏好类型的置信概率变化指数；其中，；
(1)
；，，
(2)
；
S4、
根据式
(3)
计算并选取我方智能体的最佳交互策略；
(3)
；
S5、
我方智能体采取最佳交互策略与对手智能体进行交互，采集并存储交互后我方智能体对对手智能体状态的观测结果，根据式
(4)
修正对手智能体类型的置信概率，将其记作；，
(4)
；
S6、
评估修正后的对手智能体类型的置信概率是否满足对手建模要求；若满足，则交互策略优化完成；若不满足，则利用修正后的对手智能体各类型的置信概率，重新执行步骤
S3
‑
S6。2....

【专利技术属性】
技术研发人员：魏旭飞，魏先利，刘子晓，
申请(专利权)人：崂山国家实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人