模型训练方法、数据处理方法、电子设备及计算机存储介质技术

技术编号：43799271 阅读：15 留言：0更新日期：2024-12-27 13:19

本申请实施例提供了一种模型训练方法、数据处理方法、电子设备及计算机存储介质，模型训练方法包括：获取正向训练样本数据和反向训练样本数据，正向训练样本数据包括：第一提示信息和对应的第一长文本数据；反向训练样本数据包括：第二提示信息和对应的第二长文本数据；以第一提示信息为模型输入，以第一长文本数据为训练标签，进行生成式语言模型训练，得到过渡模型；以第二长文本数据为模型输入，以第二提示信息为训练标签，训练过渡模型，得到生成式基础模型。通过本申请实施例，可以提升模型的鲁棒性，同时，增强模型的长文本创作能力，并提升创作得到的长文本数据的数据质量。

全部详细技术资料下载

【技术实现步骤摘要】

本申请实施例涉及计算机，尤其涉及一种模型训练方法、数据处理方法、电子设备及计算机存储介质。

技术介绍

1、随着自然语言处理和人工智能技术的快速发展，越来越多的人开始借助人工智能生成满足需求的文本。

2、文本创作，通常通过语义理解识别用户输入的创作主题、创作要求等信息，再进行知识库检索，从而通过预先训练完成的生成式基础模型基于检索结果进行文本创作，生成题对应的文本数据。

3、现阶段，通过传统方式训练得到的生成式基础模型，其创作能力较差，得到的文本数据通常为字数较少的短篇幅文本，并且，文本数据质量也较差。

技术实现思路

1、有鉴于此，本申请实施例提供一种模型训练方案，以至少部分解决上述问题。

2、根据本申请实施例的第一方面，提供了一种模型训练方法，包括：

3、获取正向训练样本数据和反向训练样本数据，所述正向训练样本数据包括：第一提示信息和对应的第一长文本数据；所述反向训练样本数据包括：第二提示信息和对应的第二长文本数据；

4、以所述第...

【技术保护点】

1.一种模型训练方法，包括：

2.根据权利要求1所述的方法，其中，所述以所述第一提示信息为模型输入，以所述第一长文本数据为训练标签，进行生成式语言模型训练，得到过渡模型，包括：

3.根据权利要求2所述的方法，其中，所述将所述第一预测结果作为更新后的第一长文本数据，包括：

4.根据权利要求1-3任一项所述的方法，其中，所述以所述第二长文本数据为模型输入，以所述第二提示信息为训练标签，训练所述过渡模型，得到生成式基础模型，包括：

5.根据权利要求4所述的方法，其中，所述将所述第二预测结果作为更新后的第二提示信息，包括：>

6.根据权利...

【技术特征摘要】

1.一种模型训练方法，包括：

3.根据权利要求2所述的方法，其中，所述将所述第一预测结果作为更新后的第一长文本数据，包括：

5.根据权利要求4所述的方法，其中，所述将所述第二预测结果作为更新后的第二提示信息，包括：

6.根据权利要求1所述的方法，其中，所述正向训练样本数据中还包括：第一中间数据；所述反向训练样本数据中还包括：第二中间数据；

7.根据权利要求6所述的方法，其中，所述第一中间数据为所述第一长文本数据对应的文本大纲数据；所述第二中间数据为所述第二长文本数据对应的文本大纲数据。

8.一种数据处理方法，包括：

9.根据权利要求8所述的方法，其中，所述解析所述输...

【专利技术属性】
技术研发人员：林建和，郭翼铭，
申请(专利权)人：优视科技中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人