基于模型无关元学习的雷达快速抗干扰策略获取方法技术

技术编号:41346121 阅读:29 留言:0更新日期:2024-05-20 10:01
本发明专利技术公开了一种基于模型无关元学习的雷达快速抗干扰策略获取方法,涉及雷达通信技术领域,包括:获取未知干扰策略;将未知干扰策略输入训练好的深度强化学习模型,得到未知干扰策略的抗干扰策略;其中,训练好的深度强化学习模型是将训练好的元强化学习模型的参数作为初始网络参数、以未知干扰策略作为训练数据,对初始的深度强化学习模型进行训练得到;训练好的元强化学习模型根据模型无关的元学习算法、以预训练任务集作为训练数据,对初始元强化学习模型进行训练得到;预训练任务集包括多个预训练任务,预训练任务包括雷达与干扰机的交互。本发明专利技术能够提高雷达在线学习抗干扰策略的效率。

【技术实现步骤摘要】

本专利技术属于雷达通信,具体涉及一种基于模型无关元学习的雷达快速抗干扰策略获取方法


技术介绍

1、近年来,随着干扰机的软硬件与智能化水平不断提高,雷达面临的电磁环境愈发复杂。为了提高雷达在复杂干扰环境下的适应能力与学习能力,深度强化学习(drl)引起了很多研究者的关注。

2、对于给定的任务,深度强化学习旨在与环境交互,使代理学习一个最优(或接近最优)的解决方案。与监督学习不同,代理不会被告知完成任务的“正确”行动,它只能通过与环境交互获得一个评估当前行动好坏的回报。因此,深度强化学习可以使代理自己通过交互信息学习完成给定任务的最优策略。

3、目前基于深度强化学习的雷达抗干扰策略设计方法主要集中在频率捷变(fa)雷达载频选择策略的设计上。具体而言,使用深度强化学习算法,雷达可以学会如何主动调用已知频谱资源对抗干扰机,进而从根源上减小雷达被干扰的概率。

4、然而已有工作面临的一个关键问题是交互成本高,交互量大,直接与真实干扰环境交互在线训练抗干扰策略不现实,究其原因是传统深度强化学习存在样本复杂度高、样本利用率低、训练时间本文档来自技高网...

【技术保护点】

1.一种基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,包括:

2.根据权利要求1所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,在将所述未知干扰策略输入训练好的深度强化学习模型,得到所述未知干扰策略的抗干扰策略之前,还包括:

3.根据权利要求2所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述预训练任务中的雷达与干扰机进行交互,包括:

4.根据权利要求2所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述雷达作为强化学习代理向所述干扰机发射作为雷达动作的脉冲信号的表达式为:

<...

【技术特征摘要】

1.一种基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,包括:

2.根据权利要求1所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,在将所述未知干扰策略输入训练好的深度强化学习模型,得到所述未知干扰策略的抗干扰策略之前,还包括:

3.根据权利要求2所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述预训练任务中的雷达与干扰机进行交互,包括:

4.根据权利要求2所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述雷达作为强化学习代理向所述干扰机发射作为雷达动作的脉冲信号的表达式为:

5.根据权利要求4所述的基于模型无关元学习的雷达快速抗干扰策略获取方法,其特征在于,所述预训练任务的雷达转移经验的表达式为...

【专利技术属性】
技术研发人员:纠博李康赵启龙徐丹蕾赵宇刘宏伟
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1