System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法技术_技高网

基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法技术

技术编号:41227634 阅读:11 留言:0更新日期:2024-05-09 23:45
本发明专利技术公开了一种基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,该方法包括下述步骤:预设RIS的反射元素个数、BS端的天线个数、多个用户的计算任务与时延要求;构建RIS辅助的多用户MEC系统,获取各个节点之间的信道状态,构建基于NOMA的信道模型;结合MEC服务器上的解码功率计算多用户MEC系统的总能耗,将多用户MEC系统优化目标设定为保密率与系统总能耗的比值;基于多用户TD3深度强化学习算法计算最优解;基于深度强化学习网络的学习结果,控制多用户MEC系统实现安全速率最大化计算。本发明专利技术有效地解决了MEC系统中保障用户信息安全的技术难题,从而实现了更高的安全性能。

【技术实现步骤摘要】

本专利技术涉及无线通信的通信安全,具体涉及一种基于td3强化学习与智能反射面的移动边缘计算安全速率最大化方法。


技术介绍

1、面对计算任务越来越复杂化的趋势,对于计算和存储有限的移动设备来说,满足严格的服务质量(qos)要求是一个相当大的挑战。而移动边缘计算(mec)被认为是最有前景的技术之一,它可以打破计算资源需求大与有限的计算能力之间的障碍。通过部署mec服务器,部分或全部计算任务被卸载到mec服务器上计算,以缓解本地用户的计算压力。但是,卸载到mec服务器的数据很容易被窃听,这给信息安全带来了很大的威胁。为了保证mec系统的安全性,许多学者开展了对无线物理层安全(pls)的研究,但这种方法往往需要大量的有源天线和继电器,大大增加了硬件成本和系统的复杂性。近年来,可重构智能表面(ris)被提出,它作为一种重构无线通信系统中传播信道的低成本技术,引起了研究者的广泛关注。

2、ris由许多低成本的被动反射元件组成。通过适当地调整反射元件的相移,可以利用ris来构建动态可编程的无线信道和智能无线电环境。因此,ris能够增强合法用户接收到的信号,同时抑制恶意窃听者的信号。此外,与传统的无线中继技术相比,ris只反射信号,并在低能耗的全双工模式下工作。因此,ris非常适合用于提高mec系统中用户的卸载安全性。

3、考虑到ris的潜在优势,人们开展了大量的研究。为了提高下行无线通信的安全性,研究人员提出了一种交替优化(ao)算法,联合优化基站(bs)的有源波束形成和ris的相移;为了更加符合实际情况,研究了一种ris辅助的多用户全双工安全通信系统,在考虑收发器硬件损伤(t-hwi)和ris的硬件损伤下提高总保密率(ssr)。还有许多其他关于计算卸载和能源效率的研究。研究者通过块坐标下降法,将ris辅助的多用户mec系统的总能耗最小化;一种同时传输和反射的可重构智能表面(star-ris)被提出应用在mec系统中,以使所有用户的总能耗最小。与目前仅反射入信号的传统ris相比,star-ris可以通过同时反射和传输信号来实现全空间覆盖;一种联合优化wpt-time分配、动态ris相移和lot移动设备卸载决策的方法被提出,以提高mec网络计算能力。值得注意的是,用户的计算延迟也是一个需要考虑的关键问题。学者研究了非正交多址(noma)-mec网络中关于计算卸载和资源分配的联合优化问题,以最小化所有用户的计算延迟;研究者考虑了一种通过设计ris被动反射和用户计算卸载调度来最小化两个用户和延迟最大的方案;然而,由于双路损耗导致的不可避免的衰减,被动ris的能力受到相当大的限制。因此一种利用主动ris来最小化最大计算延迟(mcl)的方法被提出。

4、虽然近年来研究者们对ris和mec进行了广泛的研究,但他们的研究往往只考虑系统的一个指标,例如只提升了安全性,却导致了系统较低能耗效率,一个同时考虑能耗、安全性能和计算延迟的系统还有待进一步探索。而且这些工作大多采用交替优化算法,其计算过程非常复杂。


技术实现思路

1、为了克服现有技术存在的缺陷与不足,本专利技术提供一种基于td3强化学习与智能反射面的移动边缘计算安全速率最大化方法,本专利技术采用了联合优化能量消耗和安全速率的技术方案,解决了提升安全性能所带来的过多额外能量消耗的技术难题,达到了节约能耗下仍然保持高安全性能的技术效果。

2、为了达到上述目的,本专利技术采用以下技术方案:

3、本专利技术提供一种基于td3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,包括下述步骤:

4、预设ris的反射元素个数n,bs端的天线个数m,多个用户的计算任务与时延要求;

5、构建ris辅助的多用户mec系统,获取各个节点之间的信道状态,构建基于noma的信道模型,基于noma的信道模型得到ris中各个元素的相移;

6、构建多用户mec系统优化目标,计算多用户mec系统的保密率,计算将用户卸载到mec服务器的任务量,设置任务切分系数,基于任务切分系数划分用户卸载到mec服务器的任务量,计算mec服务器上任务执行时间,结合mec服务器上的解码功率计算多用户mec系统的总能耗,将多用户mec系统优化目标设定为保密率与系统总能耗的比值;

7、基于多用户td3深度强化学习算法计算最优解;

8、基于深度强化学习网络的学习结果,调整ris中各个元素的相移、用户卸载到mec服务器的任务量、各个任务的执行时间与任务切分系数,控制多用户mec系统实现安全速率最大化计算。

9、作为优选的技术方案,所述构建基于noma的信道模型,具体表示为:

10、

11、

12、

13、其中,hes分别是用户s与ris、窃听者eve与用户s的总信道参数,hrb、hre、分别是用户s与ris、ris和mec系统、用户s与mec系统、ris与窃听者eve、用户s与窃听者eve之间的直连信道参数,ψ是具有n个变量的ris反射矩阵,表示ris第n个元素的相移。

14、作为优选的技术方案,所述计算多用户mec系统的保密率,具体表示为:

15、

16、

17、

18、

19、其中,cs表示保密率,表示用户i的可达率,ce表示窃听者eve的可达率,ri表示将用户i卸载到mec服务器的任务量,ti+0是用户s卸载任务的时间,b为上行noma的带宽,pi,pj分别为用户i和用户j的发射功率,σ2为噪声功率,hei表示窃听者eve和用户i之间的信道参数,hej表示窃听者eve和用户j之间的信道参数。

20、作为优选的技术方案,所述结合mec服务器上的解码功率计算多用户mec系统的总能耗,具体表示为:

21、

22、

23、

24、

25、

26、

27、

28、

29、

30、其中,etot表示总能耗,εu是在用户s处处理器芯片的能耗系数,εm为mec服务器的能耗系数,rus为用户s的本地计算任务的量,cls是在用户s处计算1比特所需的cpu周期数,eus表示用户s的本地计算能耗,fus表示用户s的本地cpu频率,cmec是在mec服务器上计算1比特所需的cpu周期数,fi+1表示在ti+1时间内mec对应的cpu频率,fi+2表示在ti+2时间内mec对应的cpu频率,fi+3表示在ti+3时间内mec对应的cpu频率,ri表示用户i卸载的任务量,rj表示用户j卸载的任务量,ti+0是用户s卸载任务的时间,α表示任务切分系数,p0表示mec服务器上的解码功率,tui表示用户i本地计算的时间消耗,tuj表示用户j本地计算的时间消耗,ps表示用户s在卸载任务时的功率,tus是用户s本地计算的总时间。

31、作为优选的技术方案,所述将多用户mec系统优化目标设定为保本文档来自技高网...

【技术保护点】

1.一种基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,所述构建基于NOMA的信道模型,具体表示为:

3.根据权利要求1所述的基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,所述计算多用户MEC系统的保密率,具体表示为:

4.根据权利要求1所述的基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,所述结合MEC服务器上的解码功率计算多用户MEC系统的总能耗,具体表示为:

5.根据权利要求1所述的基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,所述将多用户MEC系统优化目标设定为保密率与系统总能耗的比值,具体表示为:

6.根据权利要求1所述的基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,基于多用户TD3深度强化学习算法计算最优解,具体步骤包括:

7.根据权利要求6所述的基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,设定系统的奖励函数,具体表示为:

8.根据权利要求6所述的基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,初始化Actor网络的参数θμ和Critic网络的参数具体包括:

9.根据权利要求6所述的基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,通过选择目标Critic网络输出的最小值计算目标奖励值,表示为:

10.根据权利要求6所述的基于TD3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,采用梯度下降法对Critic网络的参数进行更新,具体表示为:

...

【技术特征摘要】

1.一种基于td3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,包括下述步骤:

2.根据权利要求1所述的基于td3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,所述构建基于noma的信道模型,具体表示为:

3.根据权利要求1所述的基于td3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,所述计算多用户mec系统的保密率,具体表示为:

4.根据权利要求1所述的基于td3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,所述结合mec服务器上的解码功率计算多用户mec系统的总能耗,具体表示为:

5.根据权利要求1所述的基于td3强化学习与智能反射面的移动边缘计算安全速率最大化方法,其特征在于,所述将多用户mec系统优化目标设定为保密率与系统总能耗的比值,具体表示为:

6.根据权利要求...

【专利技术属性】
技术研发人员:陈真方凯欧阳雨轩唐杰章秀银
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1