一种基于无人机辅助的星地融合网络资源智能优化方法技术

技术编号:37981707 阅读:24 留言:0更新日期:2023-06-30 09:56
本发明专利技术公开了一种基于无人机辅助的星地融合网络资源智能优化方法,涉及星地融合通信技术领域。该方法考虑了多卫星服务地面主要用户,同时,通过无人机携带智能反射面以辅助地面次要通信网络,并降低对主要用户的干扰。本方法将深度双级联相关网络嵌入到深度强化学习框架中,联合优化无人机轨迹和智能反射面参数,最大化具有干扰约束的次要用户通信速率,能够实现良好的优化效果。能够实现良好的优化效果。能够实现良好的优化效果。

【技术实现步骤摘要】
一种基于无人机辅助的星地融合网络资源智能优化方法


[0001]本专利技术涉及星地融合通信
,涉及有智能反射面辅助的认知星地融合网络中的资源配置问题,具体是一种基于深度强化学习和深度双级联相关网络的资源优化方法。

技术介绍

[0002]星地融合网络可以提高全球通信的覆盖率和通信容量,成为了未来6G通信网络中的物联网和车联网等典型应用的重要组成部分。同时,卫星通信与认知网络的结合使用,可以进一步通过频谱共享来提高通信网络的频谱使用效率。
[0003]此外,智能反射面已成为近年来6G研究的主要方向之一。由于低成本和可智能调控反射参数等特性,智能反射面可被应用于认知星地融合网络来提高非主要用户的通信速率,并同时抑制非主要通信网络对主要用户的通信干扰水平。
[0004]然而,智能反射面通常假设安装在地面如高层建筑侧面,在位置上缺乏对网络的灵活调整能力,仅能依靠调整反射参数来辅助网络通信。因此,携带智能反射面的无人机设计成为了一种新的解决方案。无人机能够自由调整所在位置,根据星地网络的通信状态将智能反射面放置在最佳位置,最大程度发挥智本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于无人机辅助的星地融合网络资源智能优化方法,其特征在于,包括以下步骤:(1)构建星地融合的认知网络,包括多个卫星、携带智能反射面的无人机、地面主要用户、地面次要通信网络,地面次要通信网络包括地面基站和地面次要用户;(2)使用马尔可夫决策过程搭建环境模型;其中包括:状态s(t),代表t时隙时星地融合网络的环境信息;动作a(t),为t时隙资源分配的决策,决策包括无人机轨迹优化和功率分配;奖励r(t),为预设的s(t)

a(t)配对奖励;agent,为虚拟智能体;(3)针对每个时隙的状态s(t),使用深度双级联相关网络进行智能反射面的反射参数优化;(4)在t时刻,agent从网络中得到状态s(t),将s(t)输入深度双级联相关网络,得到智能反射面的反射参数;(5)根据深度双级联相关网络输出的智能反射面的反射参数以及网络状态s(t),agent按照动作选择策略policy为s(t)选择对应动作a(t);动作选择策略policy初始为随机策略;(6)agent与环境交互,根据已有的s(t)

a(t)从环境得到下一时隙的状态s(t+1)和t时刻的奖励r(t);(7)在时间T内重复步骤(4)

(6),采集训练数据{s(t),a(t),r(t),s(t+1)};然后,利用近端策略优化方法更新动作选择策略policy,得到能对任何s(t...

【专利技术属性】
技术研发人员:刘允王子恺刘宁卢宁宁宋树田张乃柏黄翀陈高洁肖培
申请(专利权)人:中国电子科技集团公司第五十四研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1