一种深度学习分布式框架用的数据交换方法与装置制造方法及图纸

技术编号：20362748 阅读：17 留言：0更新日期：2019-02-16 16:28

本发明专利技术公开了一种深度学习分布式框架用的数据交换方法与装置，包括：使每个计算单元持续生成待交换数据；将待交换数据存入计算单元的缓冲区；使用比例因子压缩待交换数据的精度范围；根据计算单元的参数确定交换阈值；当缓冲区内存储的待交换数据达到交换阈值时，交换待交换数据。本发明专利技术的技术方案能够在不同计算单元或不同类型的计算单元之间按照需要交换数据，在保证数据交换时限的前提下充分利用缓存，提高数据通信性能和效率，使云计算环境下大规模数据训练的性能表现最大化。

全部详细技术资料下载

【技术实现步骤摘要】
一种深度学习分布式框架用的数据交换方法与装置
本专利技术涉及计算机领域，并且更具体地，特别是涉及一种深度学习分布式框架用的数据交换方法与装置。
技术介绍
在现有的深度学习模型中，模型为了获取更高的计算精度而变得越来越复杂。随着模型变得复杂，隐藏层的个数也增加到了多达152层，计算量相对于早期的深度学习模型也增加了许多。除了模型计算复杂度的增加以外，训练集中的样本数也呈现爆炸式的增长。如何能够快速的对大规模的数据进行训练并及时获得模型训练的参数结果，是目前所有的深度学习模型分布式算法设计过程中急需解决的问题之一。现有的深度学习数学模型基本上都可以实现在多GPU上的计算，但是扩展到多机多卡的情况时，根据数学模型算法的需要，不同GPU的计算结果需要进行规约处理，并将规约后的结果广播给所有GPU。现有技术中已经存在TensorFlow标准分布式方法ParameterServer和Uber开发的开源软件Horovod，Horovod为TensorFlow分布式框架提供了高性能ring-allreduce接口。然而，现有技术的参数服务器的分布式框架易造成网络堵塞、跨机通信亲和性低、并且难以编写；另外，由于深度神经网络模型训练过程中需要频繁的对少量数据进行通信操作，无法充分利用带宽的性能，导致不同GPU之间的数据通信性能和效率很低。针对现有技术中计算单元之间的数据通信性能和效率很低的问题，目前尚未有有效的解决方案。
技术实现思路
有鉴于此，本专利技术实施例的目的在于提出一种深度学习分布式框架用的数据交换方法与装置，能够在不同计算单元或不同类型的计算单元之间按照需要交换数据，...

【技术保护点】
1.一种深度学习分布式框架用的数据交换方法，其特征在于，包括以下步骤：使每个计算单元持续生成待交换数据；将所述待交换数据存入所述计算单元的缓冲区；使用比例因子压缩所述待交换数据的精度范围；根据所述计算单元的参数确定交换阈值；当所述缓冲区内存储的所述待交换数据达到所述交换阈值时，交换所述待交换数据。

【技术特征摘要】
1.一种深度学习分布式框架用的数据交换方法，其特征在于，包括以下步骤：使每个计算单元持续生成待交换数据；将所述待交换数据存入所述计算单元的缓冲区；使用比例因子压缩所述待交换数据的精度范围；根据所述计算单元的参数确定交换阈值；当所述缓冲区内存储的所述待交换数据达到所述交换阈值时，交换所述待交换数据。2.根据权利要求1所述的方法，其特征在于，所述待交换数据为梯度参数。3.根据权利要求1所述的方法，其特征在于，所述计算单元的参数包括以下至少之一：处理器数量、计算模型层数量、反向传播平均耗时、通信延迟；根据所述计算单元的参数确定交换阈值为：根据处理器数量、计算模型层数量、反向传播平均耗时、通信延迟中至少之一来确定交换阈值。4.根据权利要求3所述的方法，其特征在于，所述通信延迟由单次通信的信息量决定。5.根据权利要求3所述的方法，其特征在于，所述交换阈值其中P为处理器数量，L为计算模型层数量，Eavg,b...

【专利技术属性】
技术研发人员：赵旭东，景璐，
申请(专利权)人：郑州云海信息技术有限公司，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人