当前位置: 首页 > 专利查询>南京大学专利>正文

基于多目标强化学习的空间自适应传输方法及系统技术方案

技术编号:43386211 阅读:30 留言:0更新日期:2024-11-19 18:01
本发明专利技术公开了一种基于多目标强化学习的空间自适应传输方法及系统,属于空间通信技术领域。系统由链路状态监测模块、性能评估模块、链路状态预测模块、强化学习代理模块、参数调整模块、传输执行模块和数据存储模块组成,其中的强化学习代理模块作为核心决策单元,根据链路状态和性能评估结果输出最优传输参数配置;传输方法包括强化学习模型构建与训练、实时链路状态监测、未来链路状态预测、性能评估、强化学习做出决策、动态参数调整和传输执行等步骤。本发明专利技术通过多目标强化学习实现了DTN协议在复杂空间通信环境中的智能化自适应,显著提高传输效率、可靠性和资源利用率,适用于各种空间通信场景,为未来空间通信系统设计提供新的解决方案。

【技术实现步骤摘要】

本专利技术涉及空间通信,特别是一种基于多目标强化学习的空间自适应传输方法及系统


技术介绍

1、随着航天技术的快速发展和商业航天的兴起,空间网络在全球通信、深空探索、地球观测等领域扮演着越来越重要的角色。这种网络不仅包括地球同步轨道和低轨道卫星通信系统,还涵盖了月球、火星等深空探测任务中的通信需求。然而,空间网络面临着与地面网络截然不同的通信挑战。传统的传输控制协议(tcp)在空间网络中传输性能较差,主要原因在于:极长的传播延迟(如地月往返时延约2.6秒,地火往返时延3~20分钟)、高比特错误率(由于宇宙射线、太阳活动等因素导致)、间歇性连接(由于天体运动造成的周期性遮挡)以及有限的带宽和能源资源等。这些因素导致tcp的拥塞控制机制无法正常工作,频繁的超时重传和慢启动过程严重影响了传输效率。为了应对这些挑战,延迟容忍网络(dtn)协议解决方案被提出,并在空间通信中取得了相比tcp更好的传输性能。dtn协议栈的核心是捆绑协议(bundle protocol,bp)和利克莱德传输协议(licklider transmission protocol,ltp)。b本文档来自技高网...

【技术保护点】

1.一种基于多目标强化学习的空间自适应传输系统,其特征在于,所述系统包括链路状态监测模块、性能评估模块、链路状态预测模块、强化学习代理模块、参数调整模块、传输执行模块和数据存储模块,其中:

2.根据权利要求1所述的一种基于多目标强化学习的空间自适应传输系统,其特征在于,所述链路状态监测模块实时监测空间链路的各项状态参数,包括链路往返时延、可用带宽和丢包率;

3.根据权利要求1所述的一种基于多目标强化学习的空间自适应传输系统,其特征在于,所述强化学习代理模块采用深度Q网络算法实现强化学习,包括:

4.根据权利要求1所述的一种基于多目标强化学习的空间自适应...

【技术特征摘要】

1.一种基于多目标强化学习的空间自适应传输系统,其特征在于,所述系统包括链路状态监测模块、性能评估模块、链路状态预测模块、强化学习代理模块、参数调整模块、传输执行模块和数据存储模块,其中:

2.根据权利要求1所述的一种基于多目标强化学习的空间自适应传输系统,其特征在于,所述链路状态监测模块实时监测空间链路的各项状态参数,包括链路往返时延、可用带宽和丢包率;

3.根据权利要求1所述的一种基于多目标强化学习的空间自适应传输系统,其特征在于,所述强化学习代理模块采用深度q网络算法实现强化学习,包括:

4.根据权利要求1所述的一种基于多目标强化学习的空间自适应传输系统,其特征在于,所述参数调整模块包括:

5.一种基于多目标强化学习的空间自适应传输方法,该方法运行于权利要求1-4之一所述基于多目标强化学习的空间自适应传输系统,其特征在于,所述基于多目标强化学习的空间自适应传输系统依据具体应用场景优化目标构建并训练强化学习模型,应用到实际传输过程中;系统控制链路状态监测模块和链路状态预测模块实时监测并据此预测空间链路状态,同时性能评估模块对传输性能进行实时评估,强化学习代理模块综合考虑所预测的链路状态和所评估的传输性能,做出最优决策,控制参数调整模块实时动态调整协议参数,从而实现构建强化学习模型、训练强化学习模型、实时链路状态监测和预测、强化学习做出最优决策、动态参数调整和传输执行在内的空间自适应传输流程,具体包...

【专利技术属性】
技术研发人员:李文峰陈亮宋煜赵康僆
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1