基于元信息估计的自动激活值检查点搜索方法技术

技术编号：37079997 阅读：11 留言：0更新日期：2023-03-29 19:55

本发明专利技术公开了基于元信息估计的自动激活值检查点搜索方法，具体涉及深度大模型优化领域，包括以下步骤：S1、初始化模型；S2、线性化模型的建立；S3、元信息抽取；S4、动态规划求解；S5、计算图优化：S6、执行，本发明专利技术通过设计通用节点特性的传播方式，解除了部分依赖，使得模型内可视为线性化分割点的节点增多，增加了线性化网络的链长，从而增加了搜索空间，同时，本发明专利技术的线性化是全自动的，不需要对模型进行改写。写。写。

全部详细技术资料下载

【技术实现步骤摘要】
基于元信息估计的自动激活值检查点搜索方法

[0001]本专利技术涉及深度大模型优化领域，尤其涉及基于元信息估计的自动激活值检查点搜索方法。

技术介绍

[0002]随深度学习模型逐渐变得越来越大以达到更佳的精度要求。深度学习模型的参数量已经达到百亿级别，甚至千亿级别。智源悟道2.0模型甚至有1.75万亿的参数规模。
[0003]在这一背景下，使用多种技术减缓GPU内存压力是深度学习大模型训练的关键。
[0004]激活值检查点正是其中的关键之一，通过在前向传播时丢弃中间结果节省内存，再由反向传播时重计算来保证正确性。然而，虽然理论上使用激活值检查点技术，可以大幅减少训练时内存的使用，大部分机器学习工程师缺乏对如何使用该技术的直觉，导致优化的效果不理想。
[0005]当前的主流自动激活值检查点搜索方案有rotor和checkmate
[0006]rotor：该搜索系统提供了一套完整的线性化网络自动激活值检查点搜索框架
[0007]系统假设；
[0008]网络线性化：该系统假设网络可以被视为一个线性化的执行序列，即前向传播中，每一个网络层只和前一层的输出有关。
[0009]内存一致性：决定保存的激活值会留存于内存之中，在被反向计算使用之前不会在中途被丢弃；
[0010]系统流程；
[0011]通过测试获得计算序列中每一层的各项开销(激活值存储带来的内存开销、计算时间)
[0012]在线性化假设之下，将内存开销进行离散化，可以将最优激活值检查点的安...

【技术保护点】

【技术特征摘要】
1.基于元信息估计的自动激活值检查点搜索方法，其特征在于，包括以下步骤：S1、初始化模型；S2、线性化模型的建立；S3、元信息抽取；S4、动态规划求解；S5、计算图优化；S6、执行。2.根据权利要求1所述的基于元信息估计的自动激活值检查点搜索方法，其特征在于，所述步骤S1具体为：通过元跟踪来获取网络的计算图。3.根据权利要求2所述的基于元信息估计的自动激活值检查点搜索方法，其特征在于，所述步骤S2具体为：根据用户标注，以及节点特性来查找图中的通用型节点，根据节点的依赖关系，来获取可以线性化网络计算图分割点。4.根据权利要求5所述的基于元信息估计的自动激活值检查点搜索方法，其特征在于，所述步骤S3具体为：S3.1、使用新的张量数据结构虚拟产生一个位于设备上的张量；S3.2、注册一系列特殊的算子作为虚拟执行的工具，例如：多种不同的卷积算子，线性层算子，激活函数，批量归一化算子，以及一系列PyTorch原生...

【专利技术属性】
技术研发人员：李升桂，刘育良，邵彦骏，姚博远，方佳瑞，卞正达，柳泓鑫，李永彬，麦思琪，吴俊铭，陈巍文，黄海晨，路广阳，娄宇轩，
申请(专利权)人：北京潞晨科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人