获取训练样本的方法、装置、介质、设备及产品制造方法及图纸

技术编号：44937472 阅读：23 留言：0更新日期：2025-04-12 01:14

本公开涉及一种获取训练样本的方法、装置、介质、设备及产品，该方法包括：通过第一大语言模型获得第一问题对应的第一信息，展示第一信息；响应于接收到用户对第一推理过程信息的第一交互指令，获取第二推理过程信息；获取第二代码信息对应的第一执行结果信息；将第一问题、第二推理过程信息和第一执行结果信息返回第一大语言模型，并重新执行通过第一大语言模型获得第一问题对应的第一信息的步骤至展示第一信息的步骤，直至第一信息包括第一答案信息；根据第一问题、第一答案信息、第二推理过程信息和第一执行结果信息，获取用于第二大语言模型的训练样本。采用上述方案，可以得到准确的训练样本，增强训练后的第二大语言模型对问题的推理能力。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及大语言模型，具体地，涉及一种获取训练样本的方法、装置、介质、设备及产品。

技术介绍

1、大语言模型（large language model，简称llm）指使用大量文本数据训练的深度学习模型，可以生成自然语言文本或理解语言文本的含义。大语言模型在处理问题和生成答案方面表现出色，能够对用户的问题进行理解和分析并提供相应的答案。大语言模型的训练需要大量的样本，准确的样本对于保证训练出的大语言模型的精度非常重要。

技术实现思路

1、提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。

2、第一方面，本公开提供一种获取训练样本的方法，包括：

3、通过第一大语言模型获得第一问题对应的第一信息，所述第一信息包括第一答案信息或者第一推理过程信息，所述第一推理过程信息包括第一推理计划信息和用于实现所述第一推理计划信息

【技术保护点】

1.一种获取训练样本的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述第一交互指令包括对所述第一推理计划信息的第一编辑指令和/或对所述第一代码信息的第二编辑指令；

3.根据权利要求1所述的方法，其特征在于，所述第一交互指令包括对所述第一推理计划信息的第一确认指令和/或对所述第一代码信息的第二确认指令；

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述第一问题、所述第一答案信息、所述第二推理过程信息和所述第一执行结果信息，获取用于第二大语言模型的训练样本...

【技术特征摘要】

1.一种获取训练样本的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述第一交互指令包括对所述第一推理计划信息的第一编辑指令和/或对所述第一代码信息的第二编辑指令；

3.根据权利要求1所述的方法，其特征在于，所述第一交互指令包括对所述第一推理计划信息的第一确认指令和/或对所述第一代码信息的第二确认指令；

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，所述根据所述第一问题、所述第一答案信息、所述第二推理过程信息和所述第一执行结果信息，获取用于第二大语言模型的训练样本，包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

7.根据权利要求5所述的方法，其特征在于，...

【专利技术属性】
技术研发人员：孙艾玲，吴敦华，于文渊，赵晓明，邹迎春，
申请(专利权)人：北京火山引擎科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人