对手策略反演方法、系统、装置制造方法及图纸

技术编号:27744442 阅读:36 留言:0更新日期:2021-03-19 13:38
本发明专利技术属于决策推演领域,具体涉及一种对手策略反演方法、系统、装置,旨在解决现有的策略反演方法无法有效的估计对手的意图以及自适应性较差的问题。本方法包括实时获取在可见范围内对抗方各智能体的状态信息,作为输入信息;基于输入信息,结合预获取的第一概率,通过深度置信网络模型获取所述对抗方各智能体前进路线对应的后验预测概率;对所述对抗方各智能体,根据其速度,结合后验预测概率最大的前进路线,计算其对应的预测机动位置;第一概率为对抗方各智能体的时空运动轨迹经过关键地点的先验概率。本发明专利技术可有效的估计对手的意图,提升了智能体博弈对抗的能力以及自适应性。

【技术实现步骤摘要】
对手策略反演方法、系统、装置
本专利技术属于决策推演领域,具体涉及一种对手策略反演方法、系统、装置。
技术介绍
多智能体博弈具有实时对抗、群体协作、非完全信息博弈、庞大的搜索空间、多复杂任务和时间空间推理等特点,是当前人工智能领域极具挑战的难题。同时该领域研究成果在社会管理、智能交通、经济、军事等领域有广阔的应用前景。博弈中态势评估是首要关节。目前态势评估的模型有很多种,但最常用的应属Endsley三层态势评估模型。Endsley认为态势评估是决策者在一定的时间和空间内,对周围环境中要素含义的理解,以及对它们未来状态的改变进行预测,是决策者的理解过程。于是,他从人的认知角度,根据人的思维过程,把态势评估分为态势感知、态势理解和态势预测三个层面。1)态势感知,即指挥员通过多渠道对战场环境信息进行获取,如战场环境、兵力部署、作战企图/作战目标等。2)态势理解,即对所感知的信息因素结合战场环境给予深层次认识和理解。3)态势预测,即根据态势感知和理解的结果,采取相应行动后,对未来事件发展变化的一种预测。在态势评估中难度最大的是态势预测,需要对未本文档来自技高网...

【技术保护点】
1.一种对手策略反演方法,其特征在于,该方法包括以下步骤:/n步骤S10,实时获取在可见范围内对抗方各智能体的状态信息,作为输入信息;所述状态信息包括ID、时空运动轨迹、机动状态、速度;/n步骤S20,基于所述输入信息,结合预获取的第一概率,通过深度置信网络模型获取所述对抗方各智能体前进路线对应的后验预测概率;/n步骤S30,对所述对抗方各智能体,根据其速度,结合后验预测概率最大的前进路线,计算其对应的预测机动位置;/n其中,所述第一概率为对抗方各智能体的时空运动轨迹经过关键地点的先验概率。/n

【技术特征摘要】
1.一种对手策略反演方法,其特征在于,该方法包括以下步骤:
步骤S10,实时获取在可见范围内对抗方各智能体的状态信息,作为输入信息;所述状态信息包括ID、时空运动轨迹、机动状态、速度;
步骤S20,基于所述输入信息,结合预获取的第一概率,通过深度置信网络模型获取所述对抗方各智能体前进路线对应的后验预测概率;
步骤S30,对所述对抗方各智能体,根据其速度,结合后验预测概率最大的前进路线,计算其对应的预测机动位置;
其中,所述第一概率为对抗方各智能体的时空运动轨迹经过关键地点的先验概率。


2.根据权利要求1所述的对手策略反演方法,其特征在于,所述第一概率,其获取方法为:
步骤A10,采集对抗方各智能体的历史状态信息;
步骤A20,通过预设的密度聚类算法按时序对所述历史状态信息进行轨迹聚类;聚类后,将轨迹点的数量大于设定数量阈值的类对应的轨迹点作为关键地点;
步骤A30,计算对抗方各智能体的历史时空运动轨迹经过关键地点的先验概率,作为第一概率。


3.根据权利要求2所述的对手策略反演方法,其特征在于,步骤A20中“通过预设的密度聚类算法按时序对所述历史状态信息进行轨迹聚类”,其方法为:
计算当前智能体的历史时空运动轨迹与样本轨迹的垂直距离、水平距离以及夹角距离;所述样本轨迹为其他智能体的历史时空运动轨迹聚类后的轨迹;
结合预设的权重,对垂直距离、水平距离以及夹角距离进行加权求和,作为当前智能体的历史时空运动轨迹与样本轨迹之间的最终距离;
若所述最终距离小于设定的样本间距阈值,则聚为一类。


4.根据权利要求3中所述的对手策略反演方法,其特征在于,“当前智能体的时空运动轨迹与样本轨迹之间的最终距离”,其计算方法为:
dist(Li,Lj)=ω⊥.d⊥(Li,Lj)+ω||·d||(Li,Lj)+ωθ.dθ(Li,Lj)



d||=MIN(l||1,l||2)

【专利技术属性】
技术研发人员:范国梁
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1