一种并行消息处理方法、系统及相关装置制造方法及图纸

技术编号：24036815 阅读：20 留言：0更新日期：2020-05-07 02:08

本申请提供一种并行消息处理方法，包括：当第一运算器完成参数单元的计算时，发出归约操作请求至主控器，以便主控器将归约操作请求对应的参数单元全局广播至所有运算器，同时各运算器缓存参数单元；当第二运算器完成参数单元的计算得到归约数据后，第二运算器将归约数据与第二运算器缓存中的参数单元比对，生成第二运算器对应的位矢量信息；每当生成新的位矢量信息时，将各运算器对应的位矢量信息进行位与操作；根据位与操作结果执行归约操作。本申请避免了运算器频繁与主控器通信交互的弊端，主控器上的通讯压力明显减少，充分利用了带宽。本申请还提供一种并行消息处理方法、系统、计算机可读存储介质和深度学习设备，具有上述有益效果。

A parallel message processing method, system and related devices

全部详细技术资料下载

【技术实现步骤摘要】
一种并行消息处理方法、系统及相关装置
本申请涉及数据处理领域，特别涉及一种并行消息处理方法、系统及相关装置。
技术介绍
大规模分布式深度学习训练任务，尤其对于复杂模型和大规模数据集训练过程中会产生大量的消息体和消息队列，对于采用并行消息队列处理方式的数据并行分布式训练，多个GPU间独立运行各自训练数据，然后等待本节点或者其他节点的GPU完成训练然后采用不同策略来同步模型参数，此过程中产生大量的消息体和冗长的消息处理等待时间，计算单元越多，该过程所占用的时间越长。现今多个主流深度学习框架采用了消息并行处理方式进行数据并行分布式训练时产生的消息队列，但是都没有做相应优化导致在大规模计算机群上做分布式训练时有相当的性能损失。
技术实现思路
本申请的目的是提供一种并行消息处理方法、系统。计算机可读存储介质和深度学习设备，能够提高并行归约操作的执行效率。为解决上述技术问题，本申请提供一种并行消息处理方法，具体技术方案如下：当第一运算器完成参数单元的计算时，发出归约操作请求至主控器，以便所述主控器将所述参数单元全局广播至所有运算器；当各运算器接收到所述参数单元后，各所述运算器缓存所述参数单元；当第二运算器完成所述参数单元的计算得到归约数据后，所述第二运算器将所述归约数据与所述第二运算器缓存中的所述参数单元比对，生成所述第二运算器对应的位矢量信息；每当生成新的位矢量信息时，将各所述运算器对应的位矢量信息进行位与操作；根据位与操作结果执行所述归约操作。其中，...

【技术保护点】
1.一种并行消息处理方法，其特征在于，包括：/n当第一运算器完成参数单元的计算时，发出归约操作请求至主控器，以便所述主控器将所述参数单元全局广播至所有运算器；/n当各运算器接收到所述参数单元后，各所述运算器缓存所述参数单元；/n当第二运算器完成所述参数单元的计算得到归约数据后，所述第二运算器将所述归约数据与所述第二运算器缓存中的所述参数单元比对，生成所述第二运算器对应的位矢量信息；/n每当生成新的位矢量信息时，将各所述运算器对应的位矢量信息进行位与操作；/n根据位与操作结果执行归约操作。/n

【技术特征摘要】
1.一种并行消息处理方法，其特征在于，包括：
当第一运算器完成参数单元的计算时，发出归约操作请求至主控器，以便所述主控器将所述参数单元全局广播至所有运算器；
当各运算器接收到所述参数单元后，各所述运算器缓存所述参数单元；
当第二运算器完成所述参数单元的计算得到归约数据后，所述第二运算器将所述归约数据与所述第二运算器缓存中的所述参数单元比对，生成所述第二运算器对应的位矢量信息；
每当生成新的位矢量信息时，将各所述运算器对应的位矢量信息进行位与操作；
根据位与操作结果执行归约操作。

2.根据权利要求1所述的并行消息处理方法，其特征在于，所述参数单元包括归约类型、归约范围和张量。

3.根据权利要求1所述的并行消息处理方法，其特征在于，各所述运算器缓存所述参数单元包括：
各所述运算器以pre-reduce消息格式缓存所述参数单元。

4.根据权利要求1所述的并行消息处理方法，其特征在于，根据位与操作结果执行所述归约操作包括：
若各运算器对应的位矢量信息的位与操作结果为1，则各运算器执行所述归约操作。

5.根据权利要求4所述的并行消息处理方法，其特征在于，若所述位与操作结果为0，还包括：
在位与操作结果为0的双方运算器执行对所述参数单元的计算后，重新执行双方运算器对应的位矢量信息的位与操作。

6.一种并行消息处理系统，其特征在于，包括...

【专利技术属性】
技术研发人员：王超，
申请(专利权)人：广东浪潮大数据研究有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人