一种基于张量异步硬盘读写的异构空间优化器制造技术

技术编号：37878342 阅读：8 留言：0更新日期：2023-06-15 21:06

本发明专利技术公开了一种基于张量异步硬盘读写的异构空间优化器，涉及硬盘读写技术领域包括AdamOptimizer主流优化器、SGDOptimizer主流优化器、NVMeOptimizer基类优化器与TensorNVMe异步读写库；所述AdamOptimizer主流优化器，现有的主流优化器；所述SGDOptimizer主流优化器，现有的主流优化器；所述NVMeOptimizer基类优化器，通过调用TensorNVMe异步读写库，将优化过程中的计算和硬盘读写重叠起来；该基于张量异步硬盘读写的异构空间优化器，本异构空间优化器通过采用NVMeOptimizer基类优化器，使得NVMeOptimizer基类优化器通过调用TensorNVMe异步读写库，将优化过程中的计算和硬盘读写重叠起来，从而大大提升了运行效率，本异构空间优化器通过继承NVMeOptimizer基类优化器，只需进行简单的修改，即可兼容现有的主流优化器。即可兼容现有的主流优化器。即可兼容现有的主流优化器。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于张量异步硬盘读写的异构空间优化器

[0001]本专利技术涉及硬盘读写
，具体为一种基于张量异步硬盘读写的异构空间优化器。

技术介绍

[0002]以BERT、GPT为代表的预训练模型(PTM)的出现是自然语言处理(NLP)领域的里程碑事件。NLP正在进入预训练时代。PTM使用堆叠了多个Transformer结构的神经网络，在大量文本上预训练通用语言特征表示，然后通过微调将学到的知识转移到不同的下游任务。使用来自互联网的海量文本数据，PTM可以捕获自然语言的细微特征，并使下游任务获得更加惊艳的表现效果。因此，AI社区的共识是采用PTM作为特定NLP任务的主干，而不是在与任务相关的数据集上从头开始训练模型。
[0003]PTM的力量源泉是它拥有的数以亿计的参数规模，这对运行它的计算与内存资源都提出了极高的要求。由于PTM模型数据无法容纳在单个GPU的内存中，因此大多数深度学习训练框架所采用的数据并行技术不适用于PTM。GPU硬件的有限的存储规模上限，像一堵墙限制了PTM的可训练规模，因此从业人员通常称之为“GPU内存墙”现象。近两年来，业界通过利用并行训练在多个GPU内存之间分配模型数据，例如ZeRO
‑
DP、模型并行，流水线并行等尝试使PTM大小突破GPU内存墙限制。但是，这些技术仍严重依赖不断扩大GPU规模，而异构训练技术则成为破局者。它不仅可以显著提升单GPU训练模型的规模，而且可以和并行训练技术正交使用。我们将神经网络的每一个训练步分为三个阶段：前向传播、反向传播、优化器优化...

【技术保护点】

【技术特征摘要】
1.一种基于张量异步硬盘读写的异构空间优化器，其特征在于：包括AdamOptimizer主流优化器(1)、SGDOptimizer主流优化器(2)、NVMeOptimizer基类优化器(3)与TensorNVMe异步读写库(4)；所述AdamOptimizer主流优化器(1)，现有的主流优化器；所述SGDOptimizer主流优化器(2)，现有的主流优化器；所述NVMeOptimizer基类优化器(3)，通过调用TensorNVMe异步读写库(4)，将优化过程中的计算和硬盘读写重叠起来；所述TensorNVMe异步读写库(4)，能够异步的将张量从硬盘中读取到内存中或者从内存中卸载到硬盘中。2.根据权利要求1所述的一种基于张量异步硬盘读写的异构空间优化器，其特征在于：所述异构空间优化器通过继承NVMeOptimizer，进行修改，即可兼容现有的主流优化器。3.一种基于张量异步硬盘读写的异构空间优化方法，其特征在于：包括以下步骤：S1：将优化器状态存储在硬盘中；S2：在优化时，动态的将其读取到内存中，然后将其与参数一起进行计算；S3：计算完毕后再卸载回硬盘中。4.根据权利要...

【专利技术属性】
技术研发人员：柳泓鑫，赵轩磊，李升桂，方佳瑞，卞正达，李永彬，麦思琪，刘育良，黄海晨，娄宇轩，吴俊铭，路广阳，陈巍文，
申请(专利权)人：北京潞晨科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人