多层参数分布式数据传输方法、装置及可读介质制造方法及图纸

技术编号：30512685 阅读：55 留言：0更新日期：2021-10-27 22:54

本发明专利技术涉及一种多层参数分布式数据传输方法、装置及可读介质的技术方案，包括：将用于分布式学习的任意节点的参数通过UDP协议进行传输；将参数以数据字典格式的数据包在节点之间进行传输；参数被接收时创建对应的参数空间，解析数据包的数据字典配置将数据包的参数存储至指定位置；接收参数的节点对自身的参数进行更新。本发明专利技术的有益效果为：提高了分布式深度学习网络的数据通信效率，减少通信时间。减少通信时间。减少通信时间。

全部详细技术资料下载

【技术实现步骤摘要】
多层参数分布式数据传输方法、装置及可读介质

[0001]本专利技术涉及计算机网络和分布式深度学习领域，具体涉及了一种多层参数分布式数据传输方法、装置及可读介质。

技术介绍

[0002]深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习的本质就是训练具有不同网络结构的模型，通过大量的数据更新网络模型参数，使网络模型达到良好的收敛效果，达到“学习”的目的。
[0003]由于大数据的产生，用于训练一个深度学习模型的数据量过大，单台高性能服务器已经无法满足深度学习模型训练的需求，于是分布式深度学习训练应运而生，由于分布式深度学习模型训练具有以下特点：模型参数量大，训练时间长导致的通信时间较长、通信数据量较大等问题。所以如何提高各个工作节点之间的参数传输的通信效率成为了业内的一个重要研究对象。
[0004]目前业界的分布式深度学习模型训练一般使用TCP协议作为各个工作节点之间的通信协议，TCP协议具有稳定可靠但是通信效率低的特点，为了克服使用TCP协议带来的通信效率低的问题，一般将模型训练所用的服务器全部放置在一个内网中进行训练，对通信环境、带宽等要求较高，无法充分利用不在同一个内网环境中的不同服务器进行分布式训练。
[0005]如果在外网环境中采用TCP协议进行分布式训练，则会因为外网中通信环境不佳和带宽不足的问题大大延长训练的进度，无法达到分布式...

【技术保护点】

【技术特征摘要】
1.一种多层参数分布式数据传输方法，其特征在于，该方法包括：将用于分布式学习的任意节点的参数通过UDP协议进行传输；所述参数以数据字典格式的数据包在节点之间进行传输；所述参数被接收时创建对应的参数空间，解析所述数据包的数据字典配置将数据包的所述参数存储至指定位置；接收所述参数的所述节点对自身的所述参数进行更新。2.根据权利要求1所述的多层参数分布式数据传输方法，其特征在于，所述将分布式学习的任意节点的参数通过UDP协议进行传输包括：将每个所述节点已训练的模型参数通过UDP协议的广播机制发送至一个或多个其他所述节点。3.根据权利要求1所述的多层参数分布式数据传输方法，其特征在于，所述数据包包括：采用数据字典格式，每个所述数据包的字典设置至少包括训练批次、批次训练中的参数层、参数数据、发送节点及数据包序列号。4.根据权利要求1所述的多层参数分布式数据传输方法，其特征在于，所述参数空间包括：确定基于UDP通信协议传输的参数总量和所需要接受的数据包数量，所述节点接收所述数据包时创建多个字典数据结构，通过所述字典数据结构创建出接收参数的空间，其中每个所述字典数据结构对应一个所述节点的发送方；所述字典数据结构包括分布式深度学习的层及每层的数据包存放位置。5.根据权利要求4所述的多层参数分布式数据传输方法，其特征在于，所述解析所述数据包的数据字典配置将数据包的所述参数存储至指定位置包括：获取所述数据包的参数，根据所述字典数据结构的存放至指定位置。6.根据权利要求5所述的多层参数分布式数据传输方法，其特征在于，所述接收所述参数的所述节点对自身的所述参数进...

【专利技术属性】
技术研发人员：宁磊，赵建，张瑞，黄健杰，曹建民，
申请(专利权)人：深圳技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人