基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法技术

技术编号：38413738 阅读：24 留言：0更新日期：2023-08-07 11:18

本发明专利技术公开了一种基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法，包括：构建雷达与干扰机的扩展式多回合博弈交互模型，其中，雷达和干扰机分别为虚拟遗憾最小化算法的两个玩家；基于扩展式多回合博弈交互模型，结合交互信息对雷达与干扰机的信息得失进行编码，构建雷达信息集获取模型和干扰信息集获取模型；基于虚拟遗憾最小化算法，获取雷达与干扰机之间的多个博弈平均策略组合；获取每个博弈平均策略组合的利用度，并将得到利用度最小值对应的博弈平均策略组合确定为博弈双方的目标。本发明专利技术将雷达和干扰机考虑为虚拟遗憾最小化算法中的两个玩家，智能化水平相当的双方将以概率1收敛至纳什均衡。将以概率1收敛至纳什均衡。将以概率1收敛至纳什均衡。

全部详细技术资料下载

【技术实现步骤摘要】
基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法

[0001]本专利技术属于雷达
，具体涉及一种基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法。

技术介绍

[0002]主瓣干扰已成为制约雷达生存和发展的瓶颈问题，现有抗主瓣干扰方法的思路大致可以分为被动和主动两种，其中主动抗主瓣干扰技术要求雷达主动调动己方资源实现抗干扰，因其具备主动性和灵活性，目前受到广泛关注。
[0003]博弈论是利用数学模型来分析和解决现实世界中决策者之间利益冲突的理论，而雷达与干扰机存在严格竞争的利益关系，因此，基于博弈论分析雷达与干扰机之间的对抗过程并设计干扰与抗干扰策略是可行的。
[0004]现有技术中，基于博弈论进行雷达和干扰机策略设计存在以下局限：
[0005]其一、基于静态博弈对雷达和干扰机建模，虽具有一定的理论研究价值，但是缺乏表征雷达与干扰机之间序列决策这一现实需要的能力。
[0006]其二、基于动态博弈对雷达和干扰机建模时，对雷达和干扰机建模时不符合实际物理约束，也忽略了雷达和干扰机序列决策过程中...

【技术保护点】

【技术特征摘要】
1.一种基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法，其特征在于，包括：S1：构建雷达与干扰机对应的扩展式多回合博弈交互模型，其中，所述雷达和干扰机分别设置为虚拟遗憾最小化算法中的两个玩家；S2：基于所述扩展式多回合博弈交互模型，构建雷达信息集获取模型和干扰机信息集获取模型，在雷达信息集获取模型中，雷达结合自身动作以及对干扰机动作的观测信息得失，得到雷达从双方历史交互过程中获取的交互信息并进行编码；在干扰机信息集获取模型中，干扰机结合自身动作以及对雷达动作的观测信息得失，得到干扰机从双方历史交互过程中获取的交互信息并进行编码；S3：基于虚拟遗憾最小化算法并结合所述雷达信息集获取模型和所述干扰机信息集获取模型，对雷达与干扰机的交互过程进行求解，以获取雷达与干扰机之间的多个博弈平均策略组合；S4：获取每个博弈平均策略组合的利用度，并将得到利用度最小值对应的博弈平均策略组合确定为博弈双方的目标。2.根据权利要求1所述的基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法，其特征在于，所述扩展式多回合博弈交互模型包括多个交互回合，在每个交互回合中，由雷达向干扰机发送脉冲信号，所述干扰机在雷达的脉冲信号内部完成一次或多次截获并在所述脉冲信号中释放瞄准式噪声压制干扰信号，再由所述雷达接收包含所述瞄准式噪声压制干扰信号的脉冲信号。3.根据权利要求2所述的基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法，其特征在于，所述雷达为子脉冲级频率
‑
宽度捷变雷达；所述干扰机为收发分时体制，具备截获时长小于雷达最小子脉冲宽度的能力。4.根据权利要求2所述的基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法，其特征在于，所述S2包括：S2.1：将雷达第k个脉冲信号的动作表示为每个最小子脉冲宽度内的信号的频点：其中，表示雷达第k个脉冲信号的动作，各个频点满足表示每个子脉冲可选频点集合，其中，雷达发射的单个脉冲包含一个或多个子脉冲，雷达在每个脉冲内的可选动作集合均相同，记为：其中，
×
表示笛卡尔乘积；S2.2：所述干扰机截获一段雷达信号后，对雷达信号频点信息进行感知，随后发射中心频率等于所截获雷达信号载频的瞄准式噪声压制干扰信号，并开始截获状态和发射干扰信号状态的循环，直至截获不到雷达信号，将第k个脉冲下干扰机的动作表示为所有截获动作起始时刻与干扰机单次截获时长T
I
的比值：
其中，0表示干扰机截获动作起始时刻为雷达脉冲的零时刻，2表示干扰机截获动作起始时刻为雷达脉冲的2T
I
时刻，3表示干扰机截获动作起始时刻为雷达脉冲的3T
I
时刻，&表示干扰机在雷达的一个脉冲的多个时刻进行截获动作，干扰机在每个脉冲内的可选动作集合均相同，记为S2.3：所述雷达和所述干扰机在交互过程中获得目前时刻之前自身已经采取的动作以及对对手动作的观测，从而分别构建雷达信息集获取模型和干扰机信息集获取模型。5.根据权利要求4所述的基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法，其特征在于，在所述S2
‑
3中，在截至当前k个脉冲的交互过程中，雷达和干扰机采取的动作分别为与则当前时刻雷达和干扰机的历史行动：雷达观察到的信息包括：自身已经采取的动作对干扰机动作的观测其中，则在第k个脉冲下，所述雷达的交互信息表示为：其中，表示雷达的第一个脉冲的动作，表示雷达的第二个脉冲的动作，表示雷达的第k个脉冲的动作，表示在第一个脉冲下干扰机的动作，表示在第二个脉冲下干扰机的动作，表示在第k个脉冲下干扰机的动作；在交互过程中，所述干扰机观察到的信息包括：自身已经采取的动作对雷达动作的观测其中，其中，取决于干扰机进行截获动作的时机，表示干扰机在发射干扰信号时无法截获导致对该时段雷达信号频率的感知缺失，则在第k个脉冲下，所述干扰机的交互信息表示为：当k＝0时，即双方均未采取任何一个动作时，双方的交互信息为空。6.根据权利要求5所述的基于虚拟遗憾最小化算法的雷达干扰博弈策略设计方法，其特征在于，所述S3包括：S3.1：将雷达和干扰机两个玩家在各自每个信息集上的累积遗憾值初始化为以动作个数为长度的零向量，执行策略平均策略初始化为以动作个数为长度的均匀向量，其中i∈{1,
‑
1}分别表示雷达和干扰机，I
i<...

【专利技术属性】
技术研发人员：纠博，李康，王超，赵宇，刘宏伟，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人