大模型训练方法技术

技术编号:39750212 阅读:17 留言:0更新日期:2023-12-17 23:48
本申请涉及一种大模型训练方法

【技术实现步骤摘要】
大模型训练方法、装置、计算机设备集存储介质


[0001]本申请实施例涉及机器学习
,特别涉及一种大模型训练方法

装置

计算机设备集存储介质


技术介绍

[0002]大型语言模型
(
在本申请中简称大模型
)
目前得到了广泛应用,但训练大型语言模型需要巨大的数据量和算力,尤其是当大模型需要支持多种语言时,部分语种难以获取到足够数量的高质量语料,样本比例差异会导致大模型在不同语种的应用效果上存在较大的差异

[0003]在相关技术中,在大模型训练过程中可以统一各个语种的语料数量,以避免样本比例差异造成的影响

[0004]然而,上述方案中,模型训练量以及训练时长也会随样本数量大幅增加,从而使得模型训练效率较低


技术实现思路

[0005]本申请实施例提供了一种大模型训练方法

装置

计算机设备及存储介质,可以减少多语种大模型训练所需的语料样本的数据量,在使得训练获得的大模型能够进行知识和表达能力跨语种迁移的同时,提高了对大模型的训练效率

该技术方案如下:
[0006]一方面,提供了一种大模型训练方法,所述方法包括:
[0007]获取预训练样本集;所述预训练样本集中包含至少两个语种的语料样本;不同语种的语料样本的数量不同;
[0008]基于所述预训练样本集对大模型进行预训练,获得预训练后的第一大模型;
[0009]基于所述预训练样本集构建指令微调样本集;所述指令微调样本集中包含平行指令样本集以及翻译指令样本集,在所述平行指令样本集中包含任务指令的不同语种的语料样本,所述翻译指令样本集中包含翻译指令与回复文本分别为不同语种的语料样本;
[0010]基于所述指令微调样本集对所述第一大模型进行指令微调训练,获得指令微调训练后的第二大模型

[0011]另一方面,提供了一种大模型训练装置,所述装置包括:
[0012]样本集获取模块,用于获取预训练样本集;所述预训练样本集中包含至少两个语种的语料样本;不同语种的语料样本的数量不同;
[0013]预训练模块,用于基于所述预训练样本集对大模型进行预训练,获得预训练后的第一大模型;
[0014]样本集构建模块,用于基于所述预训练样本集构建指令微调样本集;所述指令微调样本集中包含平行指令样本集以及翻译指令样本集,在所述平行指令样本集中包含任务指令的不同语种的语料样本,所述翻译指令样本集中包含翻译指令与回复文本分别为不同语种的语料样本;
[0015]指令微调模块,用于基于所述指令微调样本集对所述第一大模型进行指令微调训练,获得指令微调训练后的第二大模型

[0016]在一种可能的实现方式中,所述样本集构建模块,包括:
[0017]第一获取子模块,用于从所述预训练样本集中获取目标领域的目标样本集;所述目标领域是所述任务指令对应的任务领域;
[0018]第二获取子模块,用于获取所述目标样本集中的各个目标语料样本对应的平行语料样本集;其中,平行语料样本集中的平行语料样本的语种不同;
[0019]样本集构建子模块,用于基于各个目标语料样本对应的平行语料样本集,构建所述平行指令样本集以及所述翻译指令样本集;其中,所述平行指令样本集中各个语种的语料样本的占比差异小于差异阈值

[0020]在一种可能的实现方式中,所述第二获取子模块,用于,
[0021]对各个目标语料样本进行翻译,获得各个目标语料样本对应的平行语料样本集;
[0022]和
/
或,
[0023]对所述目标样本集中的至少两个语种的语料样本进行句对抽取对齐,获得各个目标语料样本对应的平行语料样本集

[0024]在一种可能的实现方式中,所述指令微调模块,包括:
[0025]输入子模块,用于将所述指令微调样本集中的目标指令输入到所述第一大模型中,获得所述第一大模型输出的指令执行结果;所述目标指令包括所述任务指令以及所述翻译指令;
[0026]微调训练子模块,用于基于所述目标指令对应的语料样本中的回复文本以及所述指令执行结果,对所述第一大模型进行指令微调训练

[0027]在一种可能的实现方式中,所述目标样本集中的目标语料样本是所述目标领域下的语料样本中质量评分高于评分阈值的语料样本

[0028]另一方面,提供了一种计算机设备,所述计算机设备包含处理器和存储器,所述存储器存储有至少一条计算机程序,所述至少一条计算机程序由所述处理器加载并执行以实现上述的大模型训练方法

[0029]另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述的大模型训练方法

[0030]另一方面,提供了一种计算机程序产品,所述计算机程序产品包括至少一条计算机程序,所述计算机程序由处理器加载并执行以实现上述各种可选实现方式中提供的大模型训练方法

[0031]本申请提供的技术方案可以包括以下有益效果:
[0032]本申请实施例提供的大模型训练方法,在通过至少两个语种的语料样本组成的预训练样本完成对大模型的预训练之后,基于预训练样本集构建指令微调样本集,该指令微调样本集中包含平行指令样本集以及翻译指令样本集,其中,该平行指令样本集中包含任务指令的不同语种的语料样本,翻译指令样本集中包含翻译指令与回复文本分别为不同语种的语料样本,通过该指令微调样本集对预训练后的大模型进行指令微调训练,以获得训练好的大模型;通过上述方法,减少了多语种大模型训练所需的语料样本的数据量,在使得
训练获得的大模型能够进行知识和表达能力跨语种迁移的同时,提高了对大模型的训练效率

[0033]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请

附图说明
[0034]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理

[0035]图1示出了本申请一示例性实施例提供的大模型训练方法的流程图;
[0036]图2示出了本申请一示例性实施例提供的大模型训练方法的流程图;
[0037]图3示出了本申请一示例性实施例提供的大模型训练方法的架构图;
[0038]图4示出了了本申请一示例性实施例提供的大模型训练装置的方框图;
[0039]图5示出了本申请一示例性实施例示出的计算机设备的结构框图

具体实施方式
[0040]这里将详细地对示例性实施例进行说明,其示例表示在附图中

下面的描述涉及附图时,除非另有表示,不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种大模型训练方法,其特征在于,所述方法包括:获取预训练样本集;所述预训练样本集中包含至少两个语种的语料样本;不同语种的语料样本的数量不同;基于所述预训练样本集对大模型进行预训练,获得预训练后的第一大模型;基于所述预训练样本集构建指令微调样本集;所述指令微调样本集中包含平行指令样本集以及翻译指令样本集,在所述平行指令样本集中包含任务指令的不同语种的语料样本,所述翻译指令样本集中包含翻译指令与回复文本分别为不同语种的语料样本;基于所述指令微调样本集对所述第一大模型进行指令微调训练,获得指令微调训练后的第二大模型
。2.
根据权利要求1所述的方法,其特征在于,所述基于所述预训练样本集构建指令微调样本集,包括:从所述预训练样本集中获取目标领域的目标样本集;所述目标领域是所述任务指令对应的任务领域;获取所述目标样本集中的各个目标语料样本对应的平行语料样本集;其中,平行语料样本集中的平行语料样本的语种不同;基于各个目标语料样本对应的平行语料样本集,构建所述平行指令样本集以及所述翻译指令样本集;其中,所述平行指令样本集中各个语种的语料样本的占比差异小于差异阈值
。3.
根据权利要求2所述的方法,其特征在于,所述获取所述目标样本集中的各个目标语料样本的平行语料样本集,包括:对各个目标语料样本进行翻译,获得各个目标语料样本对应的平行语料样本集;和
/
或,对所述目标样本集中的至少两个语种的语料样本进行句对抽取对齐,获得各个目标语料样本对应的平行语料样本集
。4.
根据权利要求2所述的方法,其特征在于,所述基于所述指令微调样本集对所述第一大模型进行指令微调训练,包括:将所述指令微调样本集中的目标指令输入到所述第一大模型中,获得所述第一大模型输出的指令执行结果;所述目标指令包括所述任务指令以及所述翻译指令;基于所述目标指令对应的语料样本中的回复文本以及所述指令执行结果,对所述第一大模型进行指令微调训练
。5.
根据权利要求2所述的方法,其特征在于,所述目标样本集中的目标语料样本是所述目标领域下的语料样本中质量评分高于评分阈值的语料样本
...

【专利技术属性】
技术研发人员:王喆李涛
申请(专利权)人:郑州阿帕斯数云信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1