用于训练人工神经网络的系统技术方案

技术编号：38823751 阅读：17 留言：0更新日期：2023-09-15 20:03

本公开的实施例包括一种系统，用于通过基于多个训练参数配置模型以执行训练过程、监测在训练过程的执行时产生的多个统计量、以及基于统计量中的一个或多个统计量来调整训练参数中的一个或多个训练参数以将统计量中的至少一个统计量维持在预定范围内来优化人工神经网络。在一些实施例中，人工智能(AI)处理器可以对模型执行训练过程，该训练过程具有相关联的训练参数集。训练过程的执行可以产生多个统计量。耦合到(多个)AI处理器的(多个)控制处理器可以接收统计量，并且据此调整训练参数中的一个或多个训练参数，以在训练过程的执行期间将统计量中的至少一个统计量维持在预定范围内。围内。围内。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于训练人工神经网络的系统

技术介绍

[0001]本公开涉及一种计算系统。更具体地，本公开涉及用于训练人工神经网络的技术。
[0002]人工智能(AI)系统在自然语言处理和计算机视觉等多个领域取得了重大进展。AI系统通常包括由多层组成的AI模型(例如，神经网络模型)。每一层通常包括连接到其他层中的节点的节点(也称为神经元)。节点之间的连接与用于增加或减少连接强度的可训练权重相关联。在操作中，将数据集应用于模型的输入层，并且在输出层产生输出。输出可以对应于输入数据集的特定特征的分类、识别或预测。为了训练神经网络，将输出与输入数据集的已知输出进行比较，通过模型反向传播误差，并且调整模型的参数。
[0003]神经网络模型的一个问题是较大的模型通常需要较大的计算资源和/或处理时间。这在很大程度上是由于需要计算的与此类模型相关的参数的数目。
附图说明
[0004]在附图的图示中以示例而不是限制的方式示出了本公开的各种实施例。
[0005]图1示出了根据实施例的用于训练人工神经网络的系统。
[0006]图2示出了根据实施例的训练人工神经网络的方法。
[0007]图3A示出了根据实施例的人工神经网络中的训练参数和监测值。
[0008]图3B示出了根据实施例的用于训练人工神经网络的映射系统。
[0009]图4示出了根据另一实施例的训练人工神经网络的方法。
[0010]图5A示出了根据实施例的通过训练较小的网络来生成映射的系统。
[0011]图5B示出了根据实施例的加载用于...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种系统，包括：一个或多个人工智能(AI)处理器；一个或多个控制处理器；以及计算机可读存储介质，其上存储有由所述一个或多个控制处理器可执行的程序代码，所述程序代码使所述一个或多个控制处理器：接收人工神经网络模型，并且基于多个训练参数来配置所述模型，以在所述一个或多个AI处理器上执行训练过程；监测在所述训练过程的执行时产生的多个统计量；以及基于所述多个统计量中的一个或多个统计量来调整所述多个训练参数中的一个或多个训练参数，以将所述多个统计量中的至少一个统计量维持在预定范围内。2.根据权利要求1所述的系统，其中所述调整步骤包括：调整与所述模型的目标层相关联的精度，以将与所述目标层相关联的所述多个统计量中的所述至少一个统计量维持在所述预定范围内。3.根据权利要求1所述的系统，还包括：随着所述模型大小的增加而降低所述模型的至少部分的所述精度。4.根据权利要求1所述的系统，其中所述监测步骤包括：监测与所述模型的目标层相关联的一个或多个统计量。5.根据权利要求4所述的系统，其中所述一个或多个统计量包括神经网络梯度噪声的测量。6.根据权利要求1所述的系统，其中所述调整步骤包括：调整与所述模型的目标层相关联的一个或多个训练参数。7.根据权利要求6所述的系统，其中所述目标层是隐藏层，并且其中所述一个或多个训练参数包括配置针对所述目标层的精度的参数。8.根据权利要求6所述的系统，其中所述目标层是隐藏层，并且其中所述一个或多个训练参数包括配置针对所述目标层的稀疏性的参数。9.根据权利要求6所述的系统，其中所述目标层是隐藏层，并且其中所述一个或多个训练参数包括配置与所述目标层相关联的节点数目的参数。10.根据权利要求6所述的系统，其中所述目标层是隐藏层，并且其中所述一个或多个训练参数包括配置针对所述目标...

【专利技术属性】
技术研发人员：M，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人