当前位置: 首页 > 专利查询>武汉大学专利>正文

面向车联网中车辆边缘协同深度神经网络推理的在线调度方法及装置制造方法及图纸

技术编号:39419980 阅读:11 留言:0更新日期:2023-11-19 16:09
本发明专利技术提供面向车联网中车辆边缘协同深度神经网络推理的在线调度方法及装置,方法包括:步骤1,基于车联网的动态环境和车载推理任务的特征,将最小化平均推理时延的问题建模为混合整数非线性问题P1;步骤2,将P1分解为工作负载分配子问题和资源分配子问题;步骤3,求解转换后的工作负载分配子问题;步骤4,对于当前时隙t,中央调度器收集当前系统的信息,以其为输入运行演员网络得到当前时隙所有推理任务的工作负载分配;步骤5,将资源分配子问题建模为一系列独立的单时隙线性规划问题;步骤6,求解得到每个RSU当前时隙的资源分配最优解;步骤7,根据决策变量执行车载推理任务,令t=t+1,循环步骤4~7,直到系统关闭。直到系统关闭。直到系统关闭。

【技术实现步骤摘要】
面向车联网中车辆边缘协同深度神经网络推理的在线调度方法及装置


[0001]本专利技术属于边缘计算
,具体涉及一种面向车联网中车辆边缘协同深度神经网络推理的在线调度方法及装置。

技术介绍

[0002]随着5G技术和车载技术的发展,车联网中的智能应用不断涌现,如通过深度神经网络(DNN)进行物体检测和目标跟踪。然而,车辆的本地计算能力有限,一辆搭载10个高分辨率相机的汽车每秒会产生2GB的数据。通过DNN模型处理这些数据需要每秒数万亿次的计算量。在车辆上执行这样的计算密集型任务非常耗时,而车载推理任务(例如自动驾驶)通常对延迟非常敏感。因此,车辆边缘协同计算已成为提供更多计算能力并降低延迟的常见方式。通过道路边缘设施单元(RSU)中配备的边缘服务器,可以在车辆上计算DNN的一部分,并将少量中间数据传输到RSU进行余下计算。
[0003]然而,在车联网中进行协同DNN推理面临根本性的挑战。首先,DNN模型中不同层的计算工作负载和中间数据大小不同。例如,YOLOv2中的conv1层的中间数据大小约为5MB,而中间层max5的大小仅为0.08MB。在不同层上进行分区会导致不同的计算时间和数据传输时间。此外,DNN模型具有链式或有向无环图(DAG)拓扑结构,其中每个层应根据层之间的依赖关系进行计算。因此,需要设计一种最优DNN模型分区的方法,以分析DNN的特征(即拓扑/工作负载结构)来平衡计算时间和数据传输时间。其次,车联网环境是动态变化的,例如不均匀的车辆工作负载分布和不稳定的无线连接。这些不可预测的因素会影响RSU的计算资源和无线带宽资源的分配。当给车辆分配不同数量的计算资源和无线带宽资源时,DNN模型的最佳分区点会发生变化。车联网中环境的动态变化使得道路边缘设施单元RSU分配给车辆的计算资源和无线带宽资源变得不可预测,从而导致深度神经网络DNN的最佳分区点不确定。另外,请求任务处理的车辆可能会驶出RSU的信号覆盖范围,给推理结果的顺利交付带来困难。
[0004]为了实现车辆边缘协同的高效DNN推理,现有的方法都集中在端

边缘

云环境中的最优DNN分区,并未考虑动态车联网中车辆的移动性。而车联网相关的工作主要关注离线优化和资源分配,未考虑子任务之间(类似于DNN拓扑结构)的依赖关系。此外,大部分工作忽略了对带宽资源实时分配的研究。

技术实现思路

[0005]本专利技术是为了解决上述问题而进行的,目的在于提供面向车联网中车辆边缘协同深度神经网络推理的在线调度方法及装置,充分考虑车联网的动态环境(不均匀的工作负载分布和不稳定的无线连接)和车载推理任务的特征(异构DNN模型结构和车辆高速的移动性),对问题进行精确建模,并将原问题分解为工作负载分配和资源分配两个子问题分别求解,能够有效提升任务成功率,并降低任务时延。
[0006]本专利技术为了实现上述目的,采用了以下方案:
[0007]<方法>
[0008]本专利技术提供面向车联网中车辆边缘协同深度神经网络推理的在线调度方法,其特征在于,包括以下步骤:
[0009]步骤1,基于车联网的动态环境和车载推理任务的特征,将最小化平均推理时延的问题建模为混合整数非线性问题P1;
[0010]将道路分为多个等长的区域,m表示其中一个区域;用表示区域m是否在RSUs的通信信号范围覆盖内;RSUs表示第s个RSU;设车辆的区域位置在一个时隙内保持不变,并在下一个时隙的开始时更新;中央控制器为车载推理任务i选择两种角色的RSU完成协同推理,以确保中间数据和推理结果的稳定传输,分别称为helper和deliver,用h
i,s
或d
i,s
表示是否为车载推理任务i选择RSUs作为其helper或deliver协同完成推理;当车辆在推理任务计算期间一直在该RSU的信号覆盖范围内行驶时,RSU会同时被选择为helper和deliver;相应的,为DNN模型选择两个分区点,用p
i,k
或e
i,k
表示是否为车载推理任务i选择DNN模型第k层作为其第1或第2个分区点;
[0011]P1:
[0012][0013]约束条件为:
[0014][0015][0016][0017][0018][0019][0020][0021][0022]式中,I为车载推理任务数量,每一车载推理任务i∈[I];S为该道路上部署的RSU数量,每一RSUs∈[S];T为时隙数量,每一时隙t∈[T];K
i
为车载推理任务i所使用的DNN模型的逻辑层数;l
i
(t)为车载推理任务i对应的车辆在时隙t所在的区域位置;a
i
为车载任务i的到达时间;为车载推理任务i的本地计算时延;μ
i
为车载推理任务i的总时延;或为:时隙t,RSUs分配给车载推理任务i的计算资源或无线带宽资源的百分比;
[0023]步骤2,将问题P1分解为两个子问题:工作负载分配子问题、资源分配子问题,采用这两个子问题分别解决RSU和DNN分区点选择、计算资源和无线带宽分配;进一步,将工作负载分配子问题转换为一个马尔可夫决策过程;
[0024]步骤3,求解转换后的工作负载分配子问题:使用具有离散动作的软演员

评论家的深度强化学习算法进行学习得到收敛的演员网络,该收敛的演员网络作为工作负载分配
决策器;
[0025]步骤4,对于当前决策时隙t,中央调度器收集当前系统的信息,以其为输入运行演员网络得到当前决策时隙所有推理任务的工作负载分配,完成RSU和DNN分区点选择;
[0026]步骤5,将资源分配子问题建模为一系列独立的单时隙的线性规划问题,每个单时隙的线性规划问题对应一个RSU当前决策时隙的无线带宽分配问题或计算资源分配问题;
[0027]步骤6,求解每个单时隙的资源分配子问题得到每个RSU当前决策时隙的资源分配最优解,进而得到所有RSU当前决策时隙的资源分配最优解;
[0028]步骤7,根据决策变量执行车载推理任务,令t=t+1,循环步骤4~7,直到系统关闭。
[0029]优选地,本专利技术提供的面向车联网中车辆边缘协同深度神经网络推理的在线调度方法,在步骤2中,将马尔可夫决策过程由元组描述,表示时间序列的状态;表示时间序列的动作;策略函数是在给定当前状态s
t
和动作a
t
下,用于计算状态转移概率p(s
t+1
|s
t
,a
t
);是由折扣因子γ∈[0,1]衰减的奖励序列,奖励函数定义为状态、动作和奖励的具体设计如下:
[0030]i)状态:在每个时隙t,车联网环境的状态信息s
t
表示为:其中表示所有RSU的状态,表示当前决策时隙请求处理的所有车载推理任务I
t
的信息;每个RSU s的状态包括:计算资源容本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.面向车联网中车辆边缘协同深度神经网络推理的在线调度方法,其特征在于,包括如下步骤:步骤1,基于车联网的动态环境和车载推理任务的特征,将最小化平均推理时延的问题建模为混合整数非线性问题P1;设将道路分为多个等长的区域,m表示其中一个区域;用表示区域m是否在RSUs的通信信号范围覆盖内;RSUs表示第s个RSU;设车辆的区域位置在一个时隙内保持不变,并在下一个时隙的开始时更新;中央控制器为车载推理任务i选择两种角色的RSU完成协同推理,以确保中间数据和推理结果的稳定传输,分别称为helper和deliver,用h
i,s
或d
i,s
表示是否为车载推理任务i选择RSUs作为其helper或deliver协同完成推理;当车辆在推理任务计算期间一直在该RSU的信号覆盖范围内行驶时,RSU会同时被选择为helper和deliver;相应的,为DNN模型选择两个分区点,用p
i,k
或e
i,k
表示是否为车载推理任务i选择DNN模型第k层作为其第1或第2个分区点;P1:约束条件为:约束条件为:约束条件为:约束条件为:约束条件为:约束条件为:约束条件为:约束条件为:式中,I为车载推理任务数量,每一车载推理任务i∈[I];S为该道路上部署的RSU数量,每一RSUs∈[S];T为时隙数量,每一时隙t∈[T];K
i
为车载推理任务i所使用的DNN模型的逻辑层数;l
i
(t)为车载推理任务i对应的车辆在时隙t所在的区域位置;a
i
为车载任务i的到达时间;为车载推理任务i的本地计算时延;μ
i
为车载推理任务i的总时延;或为:时隙t,RSUs分配给车载推理任务i的计算资源或无线带宽资源的百分比;步骤2,将问题P1分解为两个子问题:工作负载分配子问题、资源分配子问题,采用这两个子问题分别解决RSU和DNN分区点选择、计算资源和无线带宽分配;进一步,将工作负载分配子问题转换为一个马尔可夫决策过程;步骤3,求解转换后的工作负载分配子问题:使用具有离散动作的软演员

评论家的深度强化学习算法进行学习得到收敛的演员网络,该收敛的演员网络作为工作负载分配决策器;步骤4,对于当前决策时隙t,中央调度器收集当前系统的信息,以其为输入运行演员网
络得到当前决策时隙所有推理任务的工作负载分配,完成RSU和DNN分区点选择;步骤5,将资源分配子问题建模为一系列独立的单时隙的线性规划问题,每个单时隙的线性规划问题对应一个RSU当前决策时隙的无线带宽分配问题或计算资源分配问题;步骤6,求解每个单时隙的资源分配子问题得到每个RSU当前决策时隙的资源分配最优解,进而得到所有RSU当前决策时隙的资源分配最优解;步骤7,根据决策变量执行车载推理任务,令t=t+1,循环步骤4~7,直到系统关闭。2.根据权利要求1所述的面向车联网中车辆边缘协同深度神经网络推理的在线调度方法,其特征在于:其中,在步骤2中,将马尔可夫决策过程由元组描述,表示时间序列的状态;表示时间序列的动作;策略函数是在给定当前状态s
t
和动作a
t
下,用于计算状态转移概率p(d
t+1
|s
t
,a
t
);是由折扣因子γ∈[0,1]衰减的奖励序列,奖励函数定义为状态、动作和奖励的具体设计如下:i)状态在每个时隙t,车联网环境的状态信息s
t
表示为:其中表示所有RSU的状态,表示当前决策时隙请求处理的所有车载推理任务I
t
的信息;每个RSUs的状态包括:计算资源容量C
s
,带宽资源容量B
s
,以及当前决策时隙RSU上已分配的工作负载即车载任务i的信息包括:行驶速度v
i
,车辆本地计算资源容量c
i
,传输功率ρ
i
,以及当前决策时隙车辆所在的区域位置l
i
(t),即(t),即ii)动作给定观察到的状态s
t
,中央控制器确定工作负载分配动作a
t
,即所有车载任务I
t
的RSU选择和DNN分区点选择动作a
t
定义为:iii)奖励给定状态

动作对,代理将从环境中获得奖励r
t
,用于评估动作a
t
的质量;根据P1的目标和MDP的基本逻辑,奖励函数的原则是:动作带来的推理延迟越小,返回的奖励越大;此外,考虑到约束条件(1c)和(1d),设计奖励函数以鼓励代理选择满足约束条件的动作,奖励函数定义如下:作,奖励函数定义如下:式中,r
i,t
表示车载任务i的奖励,ω表示惩罚因子。3.根据权利要求1所述的面向车联网中车辆边缘协同深度神经网络推理的在线调度方法,其特征在于:其中,在步骤5中,通过基于SAC

算法获得RSU选择和DNN模型分区决策之后,将问题P1简化为以下资源分配子问题:P2:
约束条件为:约束条件为:进一步,将问题P2分解为一系列单时隙的无线带宽分配问题和计算资源分配问题。4.根据权利要求3所述的面向车联网中车辆边缘协同深度神经网络推理的在线调度方法,其特征在于:其中,在步骤5中,无线带宽分配问题可以如下建模,对于时隙t的RSUs:P3:约束条件为:式中,I
s,t
表示在时隙t需要由RSUs分配带宽进行中间数据传输的车载任务集合;RSUs在时隙t的计算资源分配问题表示如下:P4:约束条件为:式中,I

s,t
表示在时隙t需要由RSUs分配计算资源进行进行推理任务处理的车载任务集合;X
i,s
表示车载任务i在RSUs上的计算负载,当RSUs为helper参与协同推理时当RSUs为deliver参与协同推理时当RSUs为deliver参与协同推理时5.根据权利要求1所述的面向车联网中车辆边缘协同深度神经网络推理的在线调度方法,其特征在于:其中,在步骤6中,对于每个单时隙资源分配问题,均基于凸优化理论和Karush

Kuhn

Tucker条件推导出最优解计算公式,进而得到无线带宽分配问题和计算资源分配问题的最优解。6.根据权利要求4所述的面向车联网中车辆边缘协同深度神经网络推理的在线调度方法,其特征在于:其中,在步骤6中,为了快速计算最优解,对P3和P4进行推导:对P3进行推导:δ≥0;δ≥0;式中,表示是求梯度;δ为辅助变量,根据含有该符号的三个公...

【专利技术属性】
技术研发人员:周睿婷韩紫怡
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1