一种自适应维度选择的梯度压缩方法技术

技术编号：39661217 阅读：7 留言：0更新日期：2023-12-11 18:23

本发明专利技术提供一种自适应维度选择的梯度压缩方法，用于解决在分布式训练时传输梯度造成的通信开销问题，应用梯度稀疏化方法来对梯度向量进行压缩

全部详细技术资料下载

【技术实现步骤摘要】
一种自适应维度选择的梯度压缩方法

[0001]本专利技术涉及深度学习和梯度压缩领域，具体涉及一种自适应维度选择的梯度压缩方法
。

技术介绍

[0002]分布式机器学习的出现使得多台计算设备可以并行处理训练任务，从而加快了大型神经网络的训练速度，同时也提高了模型的准确性和可靠性
。
然而在大规模深度学习模型的训练中，网络通信往往是一个非常重要的瓶颈
。
数据在不同机器设备之间的传输需要消耗大量的网络带宽和通信时间，这将延长训练时间和造成系统资源浪费，从而限制了分布式机器学习的可扩展性
。
因此，在分布式机器学习中我们需要克服通信瓶颈，优化训练过程中的通信开销
。
梯度压缩作为一种减少通信开销的方式，已经成为了分布式机器学习领域的研究热点
。
[0003]在深度学习中，模型的训练需要通过优化损失函数来最小化标签预测值与真实值之间的差距
。
优化算法通常使用随机梯度下降的方式来更新模型参数，因此梯度值的计算和传递在分布式训练过程中非常重要
。
[0004]针对上述问题，本专利技术提出了一种自适应维度选择的梯度压缩方法，设计了基于累积加权梯度的活性维度选取方法，实现梯度稀疏化，自适应选取满足条件的梯度维度参与下轮训练
。

技术实现思路

[0005]本专利技术技术解决问题：提供一种自适应维度选择的梯度压缩方法，以采用梯度稀疏化技术来解决在分布式训练时传输梯度造成的通信开销问题
...

【技术保护点】

【技术特征摘要】
1.
一种自适应维度选择的梯度压缩方法，其特征在于以下步骤：
(1)
基于累积加权梯度的活性维度选取
。
通过给本轮梯度加权提高其在全局梯度中比重，优先发送本轮中最为重要的梯度维度
。(2)
计算累积加权梯度
。
表示提高本轮梯度在全局梯度中比重的梯度，通过给本轮梯度向量加权的方式来获取
。(3)
本发明无需全局排序，而是将梯度向量均匀划分为
n
个采样区间，找到每个采样区间的全局梯度的绝对值最大值
。
再根据步骤
(2)
取得的累积加权梯度值，比较获取满足条件的梯度值
。2.
根据权利要求1所述的自适应维度选择的梯度压缩方法，其特征在于：在所述步骤
(1)
中通过基于累积加权梯度的活性维度选取方法选取生成梯度中本轮最为重要的梯度维度，设计了基于累积加权梯度活性维度选取算法，通过给本轮梯度加权提高其在全局梯度中比重，优先发送本轮中最为重要的梯度维度
。3.
在所述步骤
(2)
中，本发明中，为了选取活性梯度，需要计算全局...

【专利技术属性】
技术研发人员：朱素霞，陈俊龙，孙广路，
申请(专利权)人：哈尔滨理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人