一种模型训练显存优化方法及装置制造方法及图纸

技术编号：43844378 阅读：17 留言：0更新日期：2024-12-31 18:38

本发明专利技术公开了一种模型训练显存优化方法及装置，其中，优化方法包括：基于预设网络模型，训练一个轮次，记录每个张量的输入时刻、输出时刻、显存占用量和计算时间；根据传输速度和显存占用量，计算每个张量从GPU显存转移到主内存的转移时间开销；根据每个张量的输入、输出时刻，得到可隐藏转移开销的列表；根据可隐藏转移开销的列表，以张量的显存占用量建立大顶堆，并依次选取堆顶的张量为换入换出备选张量；在隐藏转移开销的情况下进行换入换出无法满足显存需求时，结合重计算手段进一步减少显存占用；根据上述显存优化策略，进行优化处理，使大规模网络模型在目标设备上进行训练。本发明专利技术可以在有效降低显存占用的同时，提高模型的训练速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习领域，尤其是涉及一种模型训练显存优化方法及装置。

技术介绍

1、深度学习和 ai 的发展迅速，尤其在计算机视觉、自然语言处理、推荐系统等领域。随着任务的复杂，模型也越来越大，占用显存越来越大，而gpu的内存容量是有限的，限制了模型的规模和训练速度。

2、针对显存优化，有三种常用的方法：量化（压缩、混合精度）、重计算、换入换出。量化是将模型中的高精度数值转换为低精度数值；重计算是一种策略，在前向传播过程中不存储所有中间激活值，而是在反向传播时重新计算这些值；换入换出是一种通过在显存和主内存之间动态转移数据的方式来管理显存使用。如公开号为cn112329834a的中过专利文献公开了循环网络模型训练时显存空间的分配方法和装置，有效的压缩网络计算中使用到的显存，从而提高训练速度；公开号为cn115437795a的中国专利文献公开了一种异构gpu集群负载感知的显存重计算优化方法及系统，确定所有阶段中显存负载最高的阶段，根据最小化显存开销算法进行重计算优化，保证各阶段负载均衡。

3、上述这些方法都可以降...

【技术保护点】

1.一种模型训练显存优化方法，其特征在于，包括：

2.根据权利要求1所述的模型训练显存优化方法，其特征在于，步骤（1）中，训练时，将网络输入的批大小batchsize设定为1。

3.根据权利要求1所述的模型训练显存优化方法，其特征在于，步骤（2）的具体过程为：

4.根据权利要求1所述的模型训练显存优化方法，其特征在于，步骤（3）中，依次选取堆顶的张量为换入换出备选张量，得到一个备选为换入换出的列表，具体为：

5.根据权利要求4所述的模型训练显存优化方法，其特征在于，循环遍历的结束条件为换入换出的张量显存占用量之和大于等于所需减少的显存占用量...

【技术特征摘要】

1.一种模型训练显存优化方法，其特征在于，包括：

2.根据权利要求1所述的模型训练显存优化方法，其特征在于，步骤（1）中，训练时，将网络输入的批大小batchsize设定为1。

3.根据权利要求1所述的模型训练显存优化方法，其特征在于，步骤（2）的具体过程为：

5.根据权利要求4所述的模型...

【专利技术属性】
技术研发人员：周翀，李石坚，潘纲，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人