【技术实现步骤摘要】
本专利技术属于人工智能,具体涉及一种基于差异磁盘的模型增量训练方法、装置、设备及产品。
技术介绍
1、随着信息技术的发展,人们对大模型增量训练的需求日益增长,其中,在对特定领域的垂类大模型进行训练时,往往基于已训练并固化的基础通用模型,增加额外的行业数据集来进行增量训练,而增量训练完成时产出的也是一个全量模型文件,将占用双倍的存储空间,且随着参数量的不断膨胀,模型文件往往达到数百gb甚至tb级别。
2、其中,实际应用时,在探索不同数据集对模型性能和准确性影响的试验中往往需要对同一个基础模型用不同的数据集进行增量训练,同时,团队中有不同行业的大模型训练方向时,则需要不同的组员基于同一个基础模型训练不同的行业模型;但是,现有技术在进行模型增量训练时,需要针对不同的数据集,单独拷贝一份基础模型单独进行训练,而由于模型文件高达数百gb甚至1tb,这就会浪费很多时间在模型文件的传输上,从而大大降低了模型训练的效率;同时,现有的增量训练会输出全量模型文件,进而会占用较大的存储空间,由此,如何提供一种效率高,且能够节省占用空间的模型增量训
...【技术保护点】
1.一种基于差异磁盘的模型增量训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,任一训练机器在得到对应的增量训练后的基础模型后,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,在将版本更新后的模型存储至所述新差异磁盘中后,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,在网络存储器中创建虚拟磁盘,包括:
6.根据权利要求5所述的方法,其特征在于,所述虚拟磁盘创建命令中包含有虚拟磁盘的保存路径和最大存储容量
...【技术特征摘要】
1.一种基于差异磁盘的模型增量训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,任一训练机器在得到对应的增量训练后的基础模型后,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
4.根据权利要求2所述的方法,其特征在于,在将版本更新后的模型存储至所述新差异磁盘中后,所述方法还包括:
5.根据权利要求1所述的方法,其特征在于,在网络存储器中创建虚拟磁盘,包括:
6.根据权利要求5所述的方法,其特征在于,所述虚拟磁盘创建命令中包含有虚拟磁盘的保存路径和最大存储容量,其中,根据所述保存路径和最大存储容量,创建得到所述虚拟磁盘。
7.根据权利要求1所述的方法,其特征在于,各个...
【专利技术属性】
技术研发人员:徐嘉伟,王子建,戴金良,
申请(专利权)人:四川封面传媒科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。