深度学习模型的通信优化方法及装置、存储介质制造方法及图纸

技术编号：38315197 阅读：9 留言：0更新日期：2023-07-29 08:57

本申请实施例提供了一种深度学习模型的通信优化方法及装置、存储介质，方法包括：对深度学习模型进行切分，得到位于第一通信节点下的第一子模型和位于第二通信节点下的第二子模型；在第一通信节点下，根据稀疏化比例参数和第一子模型传输的前向数据，计算前向数据的稀疏化阈值，并且根据稀疏化阈值和稀疏化比例参数对前向数据进行压缩，得到中间数据；在第二通信节点下，根据量化参数对中间数据进行解压缩，得到后向数据；向第二子模型传输后向数据以进行训练。本申请实施例中，两个子模型所处的两个通信节点之间采用低带宽网络连接，整个通信过程的负载消耗能够得到限制，从而能够在保持深度学习模型的训练精度的前提下，有效地降低通信负载。地降低通信负载。地降低通信负载。

全部详细技术资料下载

【技术实现步骤摘要】
深度学习模型的通信优化方法及装置、存储介质

[0001]本申请涉及人工智能
，尤其涉及一种深度学习模型的通信优化方法及装置、计算机可读存储介质。

技术介绍

[0002]目前，深度学习模型的训练往往需要利用高性能计算设备，单个计算设备能够提供的资源通常是有限的。随着深度学习模型的参数规模朝着越来越大的趋势发展，所需要的算力资源也越来越多，很多模型都已经无法在单个计算设备上完成训练，这时，必须将模型拆分为多个部分，将每个部分分别部署在不同的计算设备上进行训练，这个过程中，计算设备之间的通信问题是面临的重要挑战。许多情况下，单一算力中心的资源可能无法满足较大模型的训练需求，此时如果需要利用多个跨域的算力中心的计算设备，常常只能依赖于公共网络进行跨域互联，在这种低带宽环境下，通信时长会达到计算时长的数倍，严重制约着深度学习模型的训练效率。目前，通用的分布式训练压缩方案应用在数据并行场景，通过对模型的整体梯度进行压缩以降低通信负载，操作相对复杂，训练精度无法保证。因此，如何在保持深度学习模型的训练精度的前提下，有效地降低通信负载，成为了亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种深度学习模型的通信优化方法及装置、计算机可读存储介质，旨在保持深度学习模型的训练精度的前提下，有效地降低通信负载。
[0004]为实现上述目的，本申请实施例的第一方面提出了一种深度学习模型的通信优化方法，包括：
[0005]对所述深度学习模型进行切分，得到位于第一通信节点下的第...

【技术保护点】

【技术特征摘要】
1.一种深度学习模型的通信优化方法，其特征在于，包括：对所述深度学习模型进行切分，得到位于第一通信节点下的第一子模型和位于第二通信节点下的第二子模型，其中，所述第一通信节点和所述第二通信节点采用低带宽网络连接；在所述第一通信节点下，根据预配置的稀疏化比例参数和所述第一子模型传输的前向数据，计算所述前向数据的稀疏化阈值，并且根据所述稀疏化阈值和所述稀疏化比例参数对所述前向数据进行压缩，得到中间数据；将所述中间数据从所述第一通信节点传输至所述第二通信节点；在所述第二通信节点下，根据预配置的量化参数对所述中间数据进行解压缩，得到后向数据；向所述第二子模型传输所述后向数据，使得所述第二子模型根据所述后向数据进行训练。2.根据权利要求1所述的深度学习模型的通信优化方法，其特征在于，所述对所述深度学习模型进行切分，包括：获取所述深度学习模型的通信数据分布，并确定所述深度学习模型的数据输入架构；根据所述通信数据分布和所述数据输入架构对所述深度学习模型进行切分。3.根据权利要求1所述的深度学习模型的通信优化方法，其特征在于，所述前向数据包括数据批处理参数、序列长度以及隐藏层维度；所述根据预配置的稀疏化比例参数和所述第一子模型传输的前向数据，计算所述前向数据的稀疏化阈值，包括：根据所述数据批处理参数、所述序列长度以及所述隐藏层维度构建第一矩阵，并获取所述第一矩阵的总数据量；将所述稀疏化比例参数与所述第一矩阵的总数据量相乘并向下取整，得到大小为N的选择参数，N为正整数；对所述第一矩阵中的各个元素按照绝对值由小到大的顺序进行排序得到第一序列；从所述第一序列中，按序选择第N个的所述元素作为所述前向数据的稀疏化阈值。4.根据权利要求3所述的深度学习模型的通信优化方法，其特征在于，所述根据所述稀疏化阈值和所述稀疏化比例参数对所述前向数据进行压缩，得到中间数据，包括：根据所述第一矩阵构建第二矩阵和第一量化列表，其中，所述第二矩阵对应于所述前向数据，所述第一量化列表中的各个元素为空；遍历所述第一矩阵中的各个元素，在遍历的过程中，当一个所述元素的绝对值大于所述稀疏化阈值，将所述第二矩阵中的对应元素的取值配置为第一预设值，将所述第一预设值添加到所述第一量化列表中，或者，当一个所述元素的绝对值不大于所述稀疏化阈值，将所述第二矩阵中的对应元素的取值配置为第二预设值；根据所述第二矩阵、所述...

【专利技术属性】
技术研发人员：杨卿，相洋，侯永帅，余跃，王晖，
申请(专利权)人：鹏城实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人