用于人工智能建模的动态多层执行制造技术

技术编号：32508072 阅读：20 留言：0更新日期：2022-03-02 10:42

本文中所描述的方法、系统、装置和计算机程序产品支持大型AI模型在被通信地连接到参数服务器的存储器受限目标设备上的执行，该参数服务器存储AI模型的主副本。AI模型可以被分解成较小的部分(例如，层或子层)，并且每个部分可以在目标设备上尽可能高效地执行。在AI模型的一部分的执行完成之后，可以在目标设备处下载并执行AI模型的另一部分。一次执行AI模型的一部分的该范例允许大型AI模型的动态执行。的一部分的该范例允许大型AI模型的动态执行。的一部分的该范例允许大型AI模型的动态执行。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于人工智能建模的动态多层执行

技术介绍

[0001]人工智能对现代社会的很多方面已具有巨大影响。机器学习(采用数学算法来处理大型数据集的人工智能的子集)在商业应用中越来越受欢迎，并且越来越多地出现在消费者产品中。深度学习是机器学习的一个分支，其基于用于对数据中的高级抽象进行建模的算法。人工智能的很多应用都是由深度学习驱动的，诸如自然语言处理、语音识别和图像分析。
[0002]然而，存在阻碍深度学习被广泛采用的很多挑战。这些挑战包括管理大型数据集的复杂性以及训练深度学习网络所需要的大量时间和资源。例如，语音识别程序可能需要来自多种方言和人口统计数据的数据，其中可能包括单一语言的数太字节的数据。可以通过参数的数目表示深度神经网络(DNN)的复杂性，使得所存在的参数越多，DNN就越复杂。另外，优化超参数(在人工智能(AI)模型的学习过程开始之前定义的参数)可能极大地影响AI模型的性能。更进一步，需要大量的计算能力来处理用于训练这样的AI模型的大量数据。
[0003]在深度学习中，某些种类的AI模型可能需要具有高存储器容量的GPU(图形处理单元)的处理能力。为了提高吞吐量，多个GPU可以以数据并行方式运行，这通常需要同步分别存储在不同GPU中的数亿到数十亿个参数。该方法可能会受到GPU的存储器容量的限制，并且可能无法实现GPU的最大计算效率。

技术实现思路

[0004]本
技术实现思路
被提供来以简化形式介绍下面在具体实施方式中进一步描述的概念的选择。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征，也不旨在...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种系统，包括：参数服务器，通信地连接到目标设备，所述参数服务器包括：数据管理器，被配置为存储人工智能(AI)模型的主副本；批次管理器，被配置为确定适合于所述目标设备的微批次大小；传输器，被配置为向所述目标设备传输所述AI模型的一部分；输出数据管理器，被配置为从所述目标设备接收输出数据，所述输出数据是通过在所述目标设备处在所述AI模型的所传输的所述部分的子部分上执行数据集的微批次集合而被生成的；以及模型评估器，被配置为基于一个或多个度量来评估所述AI模型以确定是否需要对所述AI模型执行的任何变化。2.根据权利要求1所述的系统，其中执行所述微批次集合用于推理或用于训练所述AI模型。3.根据权利要求1所述的系统，其中所述微批次集合包括多个微批次，所述多个微批次被配置为按顺序执行，所述微批次集合形成迷你批次，所述迷你批次包括每次更新的用于训练的若干样本或者每个推理周期中提供的用于推理的若干样本。4.根据权利要求1所述的系统，其中所述一个或多个度量包括针对所述AI模型的所传输的所述部分的所述子部分的梯度和权重的精度统计。5.根据权利要求4所述的系统，其中所述参数服务器还包括精度格式化器，所述精度格式化器被配置为确定要应用于执行下一微批次集合的计算精度。6.根据权利要求1所述的系统，其中所述一个或多个度量包括所述AI模型的准确度测量。7.根据权利要求6所述的系统，其中所述参数服务器还包括模型评估器，所述模型评估器被配置为：当所述AI模型的所述准确度度量超过预定阈值时，停止所述AI模型的执行；或者当所述AI模型的所述准确度度量未超过所述预定阈值时，继...

【专利技术属性】
技术研发人员：B，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人