一种基于强化学习的自适应多信道分布式深度学习方法技术

技术编号:34604502 阅读:42 留言:0更新日期:2022-08-20 09:08
本发明专利技术公开了一种基于强化学习的自适应多信道分布式深度学习方法,称为分层梯度压缩(LGC),包括如下步骤,建立基于强化学习的自适应多信道分布式深度学习框架;框架内部每个设备计算局部梯度;框架内部的压缩器压缩梯度;通过多个通道将压缩梯度的编码层发送到边缘服务器;服务器接收所有客户端的梯度数据并进行结果计算,而后发送至框架内所有设备;每个设备使用更新后结果数据更新本地模型,利用所提出的基于学习的控制算法评估了LGC的性能,结果表明,与基准方法相比,使用此算法,LGC显着减少了训练时间,提高了资源利用率,同时实现了相似的准确性。现了相似的准确性。现了相似的准确性。

【技术实现步骤摘要】
一种基于强化学习的自适应多信道分布式深度学习方法


[0001]本专利技术涉及分布式深度学习的
,尤其涉及一种基于强化学习的自 适应多信道分布式深度学习方法。

技术介绍

[0002]近年来,研究人员和工程师已经将深度学习技术应用到包括计算机视觉、 自然语言处理、语音识别等在内的诸多领域,并取得了广泛的成功。对于移动设 备数据通常以孤岛的形式存在,收集数据进行集中训练会导致严重的隐私问 题,甚至可能被法规禁止。
[0003]跨移动设备的分布式深度学习已成为一种有效的解决方案,它可以用于分 析和处理移动边缘计算(MEC)中的数据驱动任务(例如,自动驾驶,虚拟现 实,图像分类等)的分布式数据。通过在边缘设备(例如,手机和平板电脑) 上执行训练任务并在边缘服务器上聚合学习的参数,跨设备分布式深度学习显 着减少了应用程序的网络带宽使用,并保护了边缘设备的数据隐私。
[0004]然而,要在边缘网络中实际部署分布式深度学习仍然面临一些困难。1)动 态边缘网络中,客户端和服务器之间的通信可能非常不可用、缓慢且成本高昂。 2)MEC系统中的资本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的自适应多信道分布式深度学习方法,其特征在于:包括如下步骤,建立基于强化学习的自适应多信道分布式深度学习框架;框架内部每个设备计算局部梯度;框架内部的压缩器压缩梯度;通过多个通道将压缩梯度的编码层发送到边缘服务器;服务器接收所有客户端的梯度数据并进行结果计算,而后发送至框架内所有设备;每个设备使用更新后结果数据更新本地模型。2.如权利要求1所述的基于强化学习的自适应多信道分布式深度学习方法,其特征在于:自适应多信道分布式深度学习框架包含边缘服务器和若干个设备,若干个设备通过迭代计算和通信与边缘服务器协作训练学习模型。3.如权利要求1或2所述的基于强化学习的自适应多信道分布式深度学习方法,其特征在于:在进行数据传输之前,自适应多信道分布式深度学习框架在进行信息传输之前压缩本地计算的梯度,并通过多个通道发送给各个设备。4.如权利要求3所述的基于强化学习的自适应多信道分布式深度学习方法,其特征在于:利用Top
k
运算符压缩梯度,将Top
k
扩展到Top
α,β
(1≤α<β≤D),以获得稀疏的top

(α,β)梯度。具体来说,对于向量和Top
α,β
(x)的i(i=1,2,...,D)个元素被定义为:其中x
i
是x的第i个元素,thr
α
是x中元素的第α最大绝对值,thr
β
是x中元素的第β大绝对值。5.如权利要求4所述的基于强化学习的自适应多信道分布式深度学习方法,其特征在于:需要连接到C个通道的设备,这些通道之间的流量分配由向量表...

【专利技术属性】
技术研发人员:杜海舟冯晓杰
申请(专利权)人:上海电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1