一种基于分层强化学习的车联网边缘计算任务卸载方法技术

技术编号：30537996 阅读：25 留言：0更新日期：2021-10-30 13:13

本发明专利技术属于车联网边缘计算技术领域，具体为一种基于分层强化学习的车联网边缘计算任务卸载方法。本发明专利技术首先将车联网边缘计算网络中的任务卸载问题建模为以最小化时延

全部详细技术资料下载

【技术实现步骤摘要】
一种基于分层强化学习的车联网边缘计算任务卸载方法

[0001]本专利技术属于车联网边缘计算
，具体涉及基于分层强化学习的车联网边缘计算任务卸载方法。

技术介绍

[0002]随着车联网的不断发展，辅助驾驶、增强现实和图像处理等应用已逐步在车载设备中部署，以提升车内人员的驾驶体验[1]。这些应用通常具有两大特点：计算资源需求大和实时性要求高。然而，车载设备计算资源有限且能量供应有限，往往无法满足这些应用的需求[2]。
[0003]通过引入具有强大运算能力的云服务器，移动云计算(Mobile Cloud Computing，MCC)被视为能够解决以上所述问题的有效方式[3]。为了获取充足的计算资源和节约能量消耗，车载设备可以选择将计算密集型任务卸载至云服务器中执行。尽管移动云计算能带来丰富的计算资源，但是车载设备和云服务器之间过远的物理距离将带来较长的数据传输时延，而这恰与任务的实时性要求相悖。
[0004]为了处理移动云计算的时延问题，研究人员提出了移动边缘计算(MobileEdge Computing，MEC)的概念[4]。在移动边缘计算中，拥有高运算能力的服务器不再位于遥远的云端，而是设置于离用户端更近的边缘网络中。通过结合车联网和移动边缘计算，车联网边缘计算(Vehicular edge computing，VEC)将边缘服务器部署于道路两旁的基站中，以大幅降低数据传输时延和保证数据连接的稳定性[5]。车联网边缘计算中的任务卸载问题也成为学界的研究热点。文献[6]提出了一种基于博弈论的任务卸载...

【技术保护点】

【技术特征摘要】
1.一种基于分层强化学习的车联网边缘计算任务卸载方法，其特征在于，具体步骤如下：(一)对车联网边缘计算进行数学建模，具体包括：车联网边缘计算系统模型中包含M个基站和一辆汽车，边缘服务器部署于基站中；各基站均匀分布于道路两旁，且拥有相同的覆盖范围R，各基站仅能与其覆盖范围内的车载设备建立连接；汽车以动态变化的速度v行驶于道路中；使用动态分割技术，将车载设备中的计算密集型应用分解为N个具有执行先后顺序的子任务，并以有向无环图G＝(V,E)表示，各节点i∈V代表一个任务，各有向边e(i,j)∈E代表任务i和任务j的处理顺序，即任务j需要在任务i处理完成后才能执行；问题的优化目标为最小化时延
‑
能量
‑
费用联合损失函数，定义为任务的处理时延、能量消耗和服务费用的加权和；基于任务的计算决策k
i
，即若k
i
＝0表示任务本地执行，反之若k
i
＝1表示任务本地执行，得到任务i的处理时延t
i
、能量消耗e
i
和服务费用c
i
分别为：分别为：分别为：其中，和分别为任务i的本地处理时延和边缘处理时延，和分别为任务i的本地能量消耗和边缘能量消耗，代表任务i的边缘服务费用；由此，所有任务的损失函数和U为：其中，0≤β1,β2,β3≤1表示加权系数；为了最小化系统损失函数U，需要联合优化任务卸载和资源分配策略；问题的优化参数分别为任务的执行顺序计算决策本地计算CPU频率和边缘计算传输功率于是，车联网边缘计算任务卸载问题建模为以下非线性混合整数规划：Us.t.C1:y
i
∈{0,1,
…
,N}C2:k
i
∈{0,1}C3:C4:0≤p
i
≤p
max
C5:其中，约束C1限制任务编号的取值，约束C2限制任务计算决策为本地执行或者边缘执行之一，约束C3和约束C4限制本地CPU频率和传输功率的取值范围，约束C5限制任务的执行先后顺序；该非线性混合整数规划问题为非凸且NP难，优化变量包含两个整数参数向量和以及两个连续参数和
(二)利用图神经网络提取有向无环图特征，具体包括：图神经网络为图注意力网络，由两层隐含层组成，并以ReLU(Rectified Linear Unit)作为激活函数；图神经网络的输入为节点特征矢量集其中F表示各节点特征的特征维数，N为节点特征矢量集h中分量的个数；在隐含层中，各节点输入信息通过共享的线性转换矩阵转变为高维特征，其中，F
′
表示各节点新生成的高维特征的特征维数；此外，通过引入注意力机制a:在隐含层中，将不同相邻节赋予不同的重要性程度；以相邻节点对的高维特征作为输入，计算得到注意力系数e
ij
，代表节点j的特征对于节点i的重要性程度，即：得到节点i所有相邻节点对包括节点i本身的注意力系数e
ij
后，对其进行归一化操作；具体是通过引入softmax函数，得到归一化注意力系数得到归一化注意力系数其中，表示节点i的相邻节点集合；为了更好的特征提取效果，引入多头注意力机制，即独立进行K次注意力操作a
k
后将其结果进行联立,最终得到的输出特征，其计算式为：其中||表示联立操作，K表示注意力头数，e
′
ijk
和W
k
分别表示第k次注意力才做的归一化注意力系数和权重矩阵；通过上述操作，节点的特征维度由F上升为KF
′
；(三)定义分层动作空间和强化学习建模，具体包括：智能体的动作空间为分层结构，具体分为以下三部分：(1)任务序号：车载设备需要决定任务处理的先后顺序，并不违背任务关联性；(2)计算决策：车载设备需要决定任务为本地执行或者边缘执行；(3)连续参数选择：若车载设备决定任务为本地执行，则需要确定CPU频率的分配；若车载设备决定任务为边缘执行，则需要确定传输功率；于是，问题的动作空间A表述为：A＝{a
d
,a
c
}＝{(y
i
,k
i
＝0,f
i
)∪(y
i
，k
i
＝1,p
i
)}，其中，a
d
代表离散动作集，a
c
代表连续动作集；定义智能体在时刻t选取的动作为a
t
＝(y
t
，k
t
，f
t
，p
t
)，相应的状态动作值函数为Q(s
t
，a
t
)，其中，其中，又此，得出本问题下的最优贝尔曼方程：其中，r
t
为单步奖励，γ为折扣因子；车联...

【专利技术属性】
技术研发人员：徐跃东，游新宇，戴连贵，邢万勇，
申请(专利权)人：复旦大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人