一种语言模型训练方法、装置、存储介质和电子设备制造方法及图纸

技术编号：44849916 阅读：24 留言：0更新日期：2025-04-01 19:44

本发明专利技术提供了一种语言模型训练方法、装置、存储介质和电子设备，属于自然语言处理技术领域。本发明专利技术实施例首先基于基础数据集，对初始语言模型进行训练，得到第一语言模型；然后根据第一语言模型在同一提示词下生成的回答文本对的事实性得分，将事实性得分较高的回答文本标注为优选回答，将事实性得分较低的回答文本标注为非优选回答，以构建得到偏好数据集；最后基于偏好数据集和预设的事实性强化算法，对第一语言模型进行训练，得到目标语言模型。本发明专利技术实施例利用偏好数据集对第一语言模型进行进一步的事实性强化训练，使得训练得到的目标语言模型在生成内容时能够优先选择事实性更高的文本，进而显著提升模型生成内容的事实准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自然语言处理，特别是涉及一种语言模型训练方法、装置、存储介质和电子设备。

技术介绍

1、在自然语言处理领域，基于深度学习的语言模型虽能通过在大规模文本数据上的预训练来理解文本语义，生成连贯且相关的文本片段，但在生成内容的事实准确性方面仍面临巨大挑战。语言模型经常会产生看似合理但实际错误的内容。

2、因此，如何提高语言模型的生成内容的事实准确性是目前亟需解决的技术问题。

技术实现思路

1、本专利技术提供一种语言模型训练方法、装置、存储介质和电子设备，以解决目前语言模型的生成内容的事实准确性较差的问题。

2、为了解决上述问题，本专利技术采用了以下的技术方案：

3、第一方面，本专利技术实施例提供了一种语言模型训练方法，所述方法包括：

4、基于基础数据集，对初始语言模型进行训练，得到第一语言模型；

5、获取所述第一语言模型根据多个提示词输出的多个回答文本对；

6、针对任一提示词对应的回答文本对，确定所述回答文本对...

【技术保护点】

1.一种语言模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的语言模型训练方法，其特征在于，基于基础数据集，对初始语言模型进行训练，得到第一语言模型，包括：

3.根据权利要求2所述的语言模型训练方法，其特征在于，基于所述第一复数表示和所述第二复数表示，确定角度损失函数值，包括：

4.根据权利要求2所述的语言模型训练方法，其特征在于，所述方法还包括：

5.根据权利要求4所述的语言模型训练方法，其特征在于，基于所述角度损失函数值、所述余弦损失函数值和所述批内负样本损失函数值，确定第一损失函数值，包括：