【技术实现步骤摘要】
一种用于对抗的增量式学习平衡推演方法
[0001]本专利技术属于飞行行为识别和预测
,具体涉及一种基于飞行行为识别实现的用于对抗的增量式学习平衡推演方法。
技术介绍
[0002]基于数据驱动的智能算法通常会面临一个严峻的挑战,即数据的样本数量,基于单次的态势预测无法有效的为预测算法提供数据量足够、种类丰富的样本数据,进而无法完成智能预测算法的训练。所以针对这种无人机群空中对抗演练中存在着较强不确定性以及未来的多种可能性,需要设计相应平行推演框架,实运行,实现基于关键事件节点的多仿真实例的平行推演,为后续数据处理模块或者行为预测提供原始数据来源。
[0003]平行仿真推演系统,通过根据目标当前态势信息,重构目标状态信息空间,进一步结合当前的行为理解结果,结合数据支撑模块中的专家知识产生针对未来多种可能的分支路线以及相关分支可能性的比例,形成相应的仿真推演方案,进行多线程或多进程的仿真并行推演,通过对未来多种可能性的并行推演,可以得到相应的未来状态数据。
[0004]考虑到无人机群空中对抗演练过程的博弈性和 ...
【技术保护点】
【技术特征摘要】
1.一种用于对抗的增量式学习平衡推演方法,其特征在于,包括下列步骤:步骤1,周期采集目标方的飞行状态数据,并对采集的飞行状态数据进行数据预处理,包括数据清洗和数据归一化;步骤2,将t时刻采集的并经数据预处理后的飞行状态数据输入行为识别模型,基于行为识别模型的输出行为识别结果,得到t时刻的行为A
t
,所述行为识别模型为基于深度学习的端到端模型;步骤3,基于为每一种行为类型配置的应对行为,基于t时刻的行为A
t
得到t时刻的应对行为D
t
;步骤4,设置基于时间的滑动窗口w,将t
‑
w+1到t时刻的长度为w的目标方的真实行为序列(A
t
‑
w+1
,...,A
t
)和应对行为序列(D
t
‑
w+1
,...,D
t
)作为预测模型的输入,基于平行推演得到多个推演行为序列(A
′
t
,...,A
′
t+w
‑1)1,(A
′
t
,...,A
′
t+w
‑
1)2
,...;其中,推演行为序列是从t时刻至其后的w个时刻;A
′
t
~A
′
t+w
‑1表示预测模型输出的预测行为,且预测模型为基于深度学习的端到端模型;步骤5,将多个推演行为序列分别与目标方的真实行为序列(A
t
‑
w+1
,...,A
t
)作轨迹化差异度计算,将得到的多个差异度取均值,得到最终的差异度;步骤6,基于最终的差异度生成混合样本集,并以混合样本集作为训练集训练预测模型;其中,基于最终的差异度生成混合样本集具体为:若最终的差异度低于预定义的最小差异阈值,则不执行样本混合处理;若最终的差异度高于预定义的最大差异阈值,则将目标方的真实行为序列和应对方的真实应对序列作为新样本执行样本混合处理,得到混合样本后将新样本存储到数据库中;若最终的差异度在最小差异阈值和最大差异阈值之间,则将目标方的真实行为序列和应对方的真实应对序列存入缓存区内,若缓存区超过预设缓存阈值,则将缓存区中所有数据作为新样本并执行样本混合...
【专利技术属性】
技术研发人员:张可,王素,陈伟明,贾宇明,黄乐天,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。