【技术实现步骤摘要】
大模型训练方法、装置、计算机设备集存储介质
[0001]本申请实施例涉及机器学习
,特别涉及一种大模型训练方法
、
装置
、
计算机设备集存储介质
。
技术介绍
[0002]大型语言模型
(
在本申请中简称大模型
)
目前得到了广泛应用,但训练大型语言模型需要巨大的数据量和算力,尤其是当大模型需要支持多种语言时,部分语种难以获取到足够数量的高质量语料,样本比例差异会导致大模型在不同语种的应用效果上存在较大的差异
。
[0003]在相关技术中,在大模型训练过程中可以统一各个语种的语料数量,以避免样本比例差异造成的影响
。
[0004]然而,上述方案中,模型训练量以及训练时长也会随样本数量大幅增加,从而使得模型训练效率较低
。
技术实现思路
[0005]本申请实施例提供了一种大模型训练方法
、
装置
、
计算机设备及存储介质,可以减少多语种大模型训练所需的语料样本的数据量,在使得训练获得的大模型能够进行知识和表达能力跨语种迁移的同时,提高了对大模型的训练效率
。
该技术方案如下:
[0006]一方面,提供了一种大模型训练方法,所述方法包括:
[0007]获取预训练样本集;所述预训练样本集中包含至少两个语种的语料样本;不同语种的语料样本的数量不同;
[0008]基于所述预训练样本集对大模型进行预训练,获得预训练后的第一大 ...
【技术保护点】
【技术特征摘要】
1.
一种大模型训练方法,其特征在于,所述方法包括:获取预训练样本集;所述预训练样本集中包含至少两个语种的语料样本;不同语种的语料样本的数量不同;基于所述预训练样本集对大模型进行预训练,获得预训练后的第一大模型;基于所述预训练样本集构建指令微调样本集;所述指令微调样本集中包含平行指令样本集以及翻译指令样本集,在所述平行指令样本集中包含任务指令的不同语种的语料样本,所述翻译指令样本集中包含翻译指令与回复文本分别为不同语种的语料样本;基于所述指令微调样本集对所述第一大模型进行指令微调训练,获得指令微调训练后的第二大模型
。2.
根据权利要求1所述的方法,其特征在于,所述基于所述预训练样本集构建指令微调样本集,包括:从所述预训练样本集中获取目标领域的目标样本集;所述目标领域是所述任务指令对应的任务领域;获取所述目标样本集中的各个目标语料样本对应的平行语料样本集;其中,平行语料样本集中的平行语料样本的语种不同;基于各个目标语料样本对应的平行语料样本集,构建所述平行指令样本集以及所述翻译指令样本集;其中,所述平行指令样本集中各个语种的语料样本的占比差异小于差异阈值
。3.
根据权利要求2所述的方法,其特征在于,所述获取所述目标样本集中的各个目标语料样本的平行语料样本集,包括:对各个目标语料样本进行翻译,获得各个目标语料样本对应的平行语料样本集;和
/
或,对所述目标样本集中的至少两个语种的语料样本进行句对抽取对齐,获得各个目标语料样本对应的平行语料样本集
。4.
根据权利要求2所述的方法,其特征在于,所述基于所述指令微调样本集对所述第一大模型进行指令微调训练,包括:将所述指令微调样本集中的目标指令输入到所述第一大模型中,获得所述第一大模型输出的指令执行结果;所述目标指令包括所述任务指令以及所述翻译指令;基于所述目标指令对应的语料样本中的回复文本以及所述指令执行结果,对所述第一大模型进行指令微调训练
。5.
根据权利要求2所述的方法,其特征在于,所述目标样本集中的目标语料样本是所述目标领域下的语料样本中质量评分高于评分阈值的语料样本
...
【专利技术属性】
技术研发人员:王喆,李涛,
申请(专利权)人:郑州阿帕斯数云信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。