【技术实现步骤摘要】
本专利技术属于但不限于通信,尤其涉及一种基于mec与数字孪生的空地网络优化方法及系统。
技术介绍
1、近年来,随着物联网设备的激增,传统的地面网络越来越不能满足广泛的需求,同时也面临着许多挑战:(1)时延敏感性:许多智能物联网应用对服务响应时间具有严格的要求,即低延迟需求。然而,由于设备体积和能力的限制,终端设备往往难以满足这些严苛的时延要求。(2)能耗密集型应用:智能应用通常是能耗密集型或计算密集型,需要消耗大量能量。这导致用户终端或物联网设备的电池寿命大幅缩短。(3)无线资源稀缺性:随着大量智能终端和物联网设备的接入,有限的无线频谱资源变得日益紧张。当前网络在容纳这些迅速增加的终端设备时面临巨大压力。在这种背景下,空地一体化网络的概念应运而生。通过结合不同层以提供更大的覆盖范围、更高的吞吐量、灵活的部署和强大的弹性。其中,无人机的集成为空地一体化网络带来了独特的价值。无人机作为一种典型的机载设备,已成为执行各种智能任务的关键工具,如实时图像处理、环境监测和应急响应。然而,为了使空地一体化网络高效运行,必须处理和分析无人机在执行任务期
...【技术保护点】
1.一种基于MEC与数字孪生的空地网络优化方法,其特征在于,利用深度强化学习的主策略网络和评论家网络进行智能体的学习与决策;初始化策略网络和评估网络的参数,并设置训练相关超参数;智能体根据当前策略与环境交互,执行动作并更新状态;利用经验回放缓冲区存储经验,并在达到容量时更新以保持最新的学习经验;采用损失函数计算和梯度下降法对主策略网络和评论家网络进行参数更新;定期进行目标网络中策略网络和价值网络参数的软更新,以确保学习稳定性;持续训练至策略收敛,随后应用该策略完成任务分配与轨迹规划。
2.如权利要求1所述的基于MEC与数字孪生的空地网络优化方法,其特征在于
...【技术特征摘要】
1.一种基于mec与数字孪生的空地网络优化方法,其特征在于,利用深度强化学习的主策略网络和评论家网络进行智能体的学习与决策;初始化策略网络和评估网络的参数,并设置训练相关超参数;智能体根据当前策略与环境交互,执行动作并更新状态;利用经验回放缓冲区存储经验,并在达到容量时更新以保持最新的学习经验;采用损失函数计算和梯度下降法对主策略网络和评论家网络进行参数更新;定期进行目标网络中策略网络和价值网络参数的软更新,以确保学习稳定性;持续训练至策略收敛,随后应用该策略完成任务分配与轨迹规划。
2.如权利要求1所述的基于mec与数字孪生的空地网络优化方法,其特征在于,基于mec与数字孪生的空地网络优化方法具体包括:
3.如权利要求2所述的基于mec与数字孪生的空地网络优化方法,其特征在于,所述s102、初始化智能体的状态,智能体与环境互动,主策略网络基于当前策略生成动作,智能体的状态表示为:
4.如权利要求2所述的基于mec与数字孪生的空地网络优化方法,其特征在于,所述s103:智能体执行主策略网络生成的动作,获得奖励,并更新状态,状态更新中奖励reward的计算公...
【专利技术属性】
技术研发人员:杜剑波,王嘉煊,卢光跃,姜静,朱国晖,王瑾,任德锋,
申请(专利权)人:西安邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。