【技术实现步骤摘要】
本专利技术属于雷达通信,具体涉及一种基于模型无关元学习的雷达快速抗干扰策略获取方法。
技术介绍
1、近年来,随着干扰机的软硬件与智能化水平不断提高,雷达面临的电磁环境愈发复杂。为了提高雷达在复杂干扰环境下的适应能力与学习能力,深度强化学习(drl)引起了很多研究者的关注。
2、对于给定的任务,深度强化学习旨在与环境交互,使代理学习一个最优(或接近最优)的解决方案。与监督学习不同,代理不会被告知完成任务的“正确”行动,它只能通过与环境交互获得一个评估当前行动好坏的回报。因此,深度强化学习可以使代理自己通过交互信息学习完成给定任务的最优策略。
3、目前基于深度强化学习的雷达抗干扰策略设计方法主要集中在频率捷变(fa)雷达载频选择策略的设计上。具体而言,使用深度强化学习算法,雷达可以学会如何主动调用已知频谱资源对抗干扰机,进而从根源上减小雷达被干扰的概率。
4、然而已有工作面临的一个关键问题是交互成本高,交互量大,直接与真实干扰环境交互在线训练抗干扰策略不现实,究其原因是传统深度强化学习存在样本复杂度高、样
...【技术保护点】
1.一种基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,包括:
2.根据权利要求1所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,在将所述未知干扰策略输入训练好的深度强化学习模型,得到所述未知干扰策略的抗干扰策略之前,还包括:
3.根据权利要求2所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述预训练任务中的雷达与干扰机进行交互,包括:
4.根据权利要求2所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述雷达作为强化学习代理向所述干扰机发射作为雷达动作的脉冲信号的
<...【技术特征摘要】
1.一种基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,包括:
2.根据权利要求1所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,在将所述未知干扰策略输入训练好的深度强化学习模型,得到所述未知干扰策略的抗干扰策略之前,还包括:
3.根据权利要求2所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述预训练任务中的雷达与干扰机进行交互,包括:
4.根据权利要求2所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述雷达作为强化学习代理向所述干扰机发射作为雷达动作的脉冲信号的表达式为:
5.根据权利要求4所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述预训练任务的雷达转移经验的表达式为...
【专利技术属性】
技术研发人员:纠博,李康,赵启龙,徐丹蕾,赵宇,刘宏伟,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。