温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本公开实施例是关于一种基于元深度强化学习的跳频干扰资源分配方法,包括:根据通信对抗场景构建跳频干扰资源分配问题;将跳频干扰资源分配问题建模为马尔可夫决策过程;随机初始化元策略得到初始策略网络;基于MAML算法对初始策略网络进行元训练,元训练...该专利属于中国人民解放军空军工程大学所有,仅供学习研究参考,未经过中国人民解放军空军工程大学授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本公开实施例是关于一种基于元深度强化学习的跳频干扰资源分配方法,包括:根据通信对抗场景构建跳频干扰资源分配问题;将跳频干扰资源分配问题建模为马尔可夫决策过程;随机初始化元策略得到初始策略网络;基于MAML算法对初始策略网络进行元训练,元训练...