【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种基于分块交错流水线的模型更新方法、装置、计算机可读存储介质、电子设备及计算机程序产品。
技术介绍
1、随着神经网络模型规模的不断增长,模型参数量呈现指数级增加(如模型gpt-3拥有约1750亿个参数),使得显存资源的瓶颈问题变得愈加突出。
2、在模型训练场景中,需要频繁更新模型参数和优化器状态。例如,自适应矩估计(adaptive moment estimation,adam)优化器需要为每个模型参数维护额外的状态信息(即动量和方差估计),这使得优化器状态的存储需求通常是模型参数量的两倍以上,使得显存占用也成倍增加。
3、以175b参数的gpt-3模型为例,图形处理器(graphics processing unit,gpu)在使用16位浮点数格式进行推理计算时,需要350gb的存储空间,相当于8张a6000-48gb gpu或5张a100-80gb gpu。按照同样的参数规模进行模型训练时,权重使用16位浮点数格式,梯度使用32位浮点数格式,同时还需要维护32位浮点数格式的主
...【技术保护点】
1.一种基于分块交错流水线的模型更新方法,其特征在于,应用于人工智能处理器;所述方法包括:
2.如权利要求1所述的基于分块交错流水线的模型更新方法,其特征在于,所述中央处理器按照预设尺寸划分出多个连续的内存块存储目标模型的所述待更新数据块和所述已更新数据块中的至少一者。
3.如权利要求2所述的基于分块交错流水线的模型更新方法,其特征在于,所述预设尺寸通过以下步骤确定:
4.如权利要求1所述的基于分块交错流水线的模型更新方法,其特征在于,所述根据本次模型迭代计算生成的梯度数据,对所述待更新数据块进行更新,得到已更新数据块,包括:
>5.如权利要...
【技术特征摘要】
1.一种基于分块交错流水线的模型更新方法,其特征在于,应用于人工智能处理器;所述方法包括:
2.如权利要求1所述的基于分块交错流水线的模型更新方法,其特征在于,所述中央处理器按照预设尺寸划分出多个连续的内存块存储目标模型的所述待更新数据块和所述已更新数据块中的至少一者。
3.如权利要求2所述的基于分块交错流水线的模型更新方法,其特征在于,所述预设尺寸通过以下步骤确定:
4.如权利要求1所述的基于分块交错流水线的模型更新方法,其特征在于,所述根据本次模型迭代计算生成的梯度数据,对所述待更新数据块进行更新,得到已更新数据块,包括:
5.如权利要求1所述的基于分块交错流水线的模型更新方法,其特征在于,所述将所述已更新数据块卸载至所述中央处理器之前,所述方法还包括:
6.如权利要求2所述的基于分块交错流水线的模型更新方法,其特征在于,所述内存块为锁页内存。
7.如权利要求1...
【专利技术属性】
技术研发人员:请求不公布姓名,
申请(专利权)人:广州壁仞集成电路有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。