神经网络模型的训练方法、图像处理方法及装置制造方法及图纸

技术编号：34284230 阅读：38 留言：0更新日期：2022-07-27 08:04

本申请公开了人工智能领域中的一种神经网络模型的训练方法、图像处理方法及装置。该训练方法包括：第一加速器根据第一参数梯度更新神经网络模型的部分参数，在数据并行的参数梯度同步过程中，第一加速器通过带宽较小的第二链路接收第四参数梯度的一部分，通过带宽较大的第一链路接收第三参数梯度和第四参数梯度的其他部分，进而根据第三参数梯度、第四参数梯度以及自身得到第二参数梯度确定第一参数梯度。本申请的方法能够减少训练过程中的通信开销，进而提高神经网络模型的训练效率。进而提高神经网络模型的训练效率。进而提高神经网络模型的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型的训练方法、图像处理方法及装置

[0001]本申请涉及人工智能领域，并且更具体地，涉及一种神经网络模型的训练方法、图像处理方法及装置。

技术介绍

[0002]人工智能(artificial intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人，自然语言处理，计算机视觉，决策与推理，人机交互，推荐与搜索，AI基础理论等。
[0003]在人工智能领域，通过对神经网络模型进行训练能够得到性能较优的目标神经网络模型以执行各种数据处理工作。在单个加速器的计算能力和内存大小无法满足神经网络模型训练的情况下，可以采用分布式并行训练的方式训练神经网络模型。其中，分布式并行训练包括数据并行的训练方式，即集群中的每个加速器分别基于不同的训练样本计算相同的神经网络模型的参数梯度，对各个加速器得到的参数梯度进行参数梯度同步，并根据同步后的参数梯度更新该神经网络模型的参数。若一个服务器中的加速器的数量无法满足神经网络模型的训练，可以利用多个服务器中的加速器共同完成该神经网络模型的训练。然而，服务器之间的带宽较低，影响参数梯度同步过程中的数据传输速度，进而导致神经网络模型的训练效...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型的训练方法，其特征在于，包括：第一加速器获取至少一个第一训练样本；所述第一加速器根据第一参数梯度更新神经网络模型的至少部分参数，其中，所述第一参数梯度是根据第二参数梯度、第三参数梯度和第四参数梯度确定的，所述第二参数梯度、所述第三参数梯度和所述第四参数梯度为基于不同的训练样本得到的所述至少部分参数对应的参数梯度，所述第二参数梯度是所述第一加速器基于所述至少一个第一训练样本得到的，所述第三参数梯度为所述第一加速器通过第一链路从第二加速器接收的，所述第四参数梯度中的一部分为所述第一加速器通过第二链路从第三加速器接收的，所述第四参数梯度中的其他部分为所述第一加速器通过所述第一链路从所述第二加速器接收的，其中，所述第一链路的带宽大于所述第二链路的带宽。2.根据权利要求1所述的方法，其特征在于，所述第四参数梯度是根据所述第三加速器基于至少一个第三训练样本得到的参数梯度和第四加速器基于至少一个第四训练样本得到的参数梯度确定的，所述第四参数梯度中的一部分位于所述第三加速器上，所述第四参数梯度中的其他部分位于所述第四加速器上。3.根据权利要求1或2所述的方法，其特征在于，所述第一参数梯度是根据所述第二参数梯度、第三参数梯度和第四参数梯度确定的，包括：所述第一加速器基于所述第二参数梯度与所述第二加速器中的所述第三参数梯度执行规约和发散操作，得到第五参数梯度，所述第五参数梯度是根据所述第二参数梯度中的一部分和所述第三参数梯度中的一部分确定的；所述第一加速器基于所述第五参数梯度与所述第三加速器中的所述第四参数梯度中的一部分执行全局规约操作，得到第六参数梯度；所述第一加速器基于所述第六参数梯度与所述第二加速器中的第七参数梯度执行全局聚合操作，得到所述第一参数梯度，所述第七参数梯度是根据所述第四参数梯度中的其他部分、所述第二参数梯度中的其他部分和所述第三参数梯度中的其他部分确定的。4.根据权利要求1至3中任一项所述的方法，其特征在于，所述第一加速器属于第一模型并行组，所述第一模型并行组中的多个加速器以模型并行的方式训练所述神经网络模型。5.根据权利要求4所述的方法，其特征在于，在所述第一加速器与所述第二加速器进行数据传输的过程中，若所述第一加速器与所述第一模型并行组中的其他加速器开始通过所述第一链路进行数据传输，挂起所述第一加速器与所述第二加速器之间的数据传输进程。6.根据权利要求1至5中任一项所述的方法，其特征在于，所述第三参数梯度为所述第二加速器基于至少一个第二训练样本得到的。7.一种图像处理方法，其特征在于，包括：获取待处理图像；利用目标神经网络模型对所述待处理图像进行处理，得到所述待处理图像的处理结果，其中，所述目标神经网络模型是通过第一加速器根据第一参数梯度更新神经网络模型的至少部分参数得到的，所述第一参数梯度是根据第二参数梯度、第三参数梯度和第四参
数梯度确定的，所述第二参数梯度、所述第三参数梯度和所述第四参数梯度为基于不同的训练样本得到的所述至少部分参数对应的参数梯度，所述第二参数梯度是所述第一加速器基于至少一个第一训练样本得到的，所述第三参数梯度为所述第一加速器通过第一链路从第二加速器接收的，所述第四参数梯度中的一部分为所述第一加速器通过第二链路从第三加速器接收的，所述第四参数梯度中的其他部分为所述第一加速器通过所述第一链路从所述第二加速器接收的，其中，所述第一链路的带宽大于所述第二链路的带宽。8.根据权利要求7所述的方法，其特征在于，所述第四参数梯度是根据所述第三加速器基于至少一个第三训练样本得到的参数梯度和第四加速器基于至少一个第四训练样本得到的参数梯度确定的，所述第四参数梯度中的一部分位于所述第三加速器上，所述第四参数梯度中的其他部分位于所述第四加速器上。9.根据权利要求7或8所述的方法，其特征在于，所述第一参数梯度是根据所述第二参数梯度、第三参数梯度和第四参数梯度确定的，包括：所述第一参数梯度是所述第一加速器基于所述第六参数梯度与所述第二加速器中的第七参数梯度执行全局聚合操作得到的，所述第六参数梯度是所述第一加速器基于第五参数梯度与所述第三加速器中的所述第四参数梯度中的一部分执行全局规约操作得到的，所述第五参数梯度是所述第一加速器基于所述第二参数梯度与所述第二加速器中的所述第三参数梯度执行规约和发散操作得到的，所述第五参数梯度是根据所述第二参数梯度中的一部分和所述第三参数梯度中的一部分确定的，所述第七参数梯度是根据所述第四参数梯度中的其他部分、所述第二参数梯度中的其他部分和所述第三参数梯度中的其他部分确定的。10.根据权利要求7至9中任一项所述的方法，其特征在于，所述第一加速器属于第一模型并行组，所述第一模型并行组中的多个加速器以模型并行的方式训练所述神经网络模型。11.根据权利要求7至10中任一项所述的方法，其特征在于，所述第三参数梯度为所述第二加速器基于至少一个第二训练样本得到的。12.一种神经网络模型的训练装置，其特征在于，所述训练装置包括：获取单元，用于获取至少一个第一训练样本；处理单元，用于根据第一参数梯度更新神经网络模型的至少部分参数；其中，所述第一参数梯度是根据第二参数梯度、第三参数梯度和第四参数梯度确定的，所述第二参数梯度、所述第三参数梯度和所述第四参数梯度为基于不同的训练样本得到的所述至少部分参数对应的参数梯度，所述第二参数梯度是所述处理单...

【专利技术属性】
技术研发人员：陈仙萍，马力，杨华，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人