训练样本获取及大模型优化训练方法和装置制造方法及图纸

技术编号：41142453 阅读：20 留言：0更新日期：2024-04-30 18:11

本公开提供了训练样本获取及大模型优化训练方法和装置，涉及大模型、深度学习以及自然语言处理等人工智能领域。其中的训练样本获取方法可包括：响应于确定符合优化触发条件，将从预定数据源收集到的可作为大模型输入的查询作为候选查询；从候选查询中筛选出目标查询，目标查询为大模型无法正确处理的查询；根据各目标查询，分别构建出对应的训练样本，所述训练样本用于对大模型进行优化训练。应用本公开所述方案，可提升大模型的推理能力等。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能，特别涉及大模型、深度学习和自然语言处理等领域的训练样本获取及大模型优化训练方法和装置。

技术介绍

1、大模型是指使用大量文本数据训练得到的深度学习模型，可以生成自然语言文本或理解自然语言文本的含义等。大模型的出现可能从根本上改变人类与机器的交互方式，重塑整个计算生态系统。

技术实现思路

1、本公开提供了训练样本获取及大模型优化训练方法和装置。

2、一种训练样本获取方法，包括：

3、响应于确定符合优化触发条件，将从预定数据源收集到的可作为大模型输入的查询作为候选查询；

4、从所述候选查询中筛选出目标查询，所述目标查询为所述大模型无法正确处理的查询；

5、根据各目标查询，分别构建出对应的训练样本，所述训练样本用于对所述大模型进行优化训练。

6、一种大模型优化训练方法，包括：

7、获取训练样本，所述训练样本为根据各目标查询分别构建出的对应的训练样本，所述目标查询为从候选查询中筛选出的大模型无法正确处理的查...

【技术保护点】

1.一种训练样本获取方法，包括：

2.根据权利要求1所述的方法，其中，所述从所述候选查询中筛选出目标查询包括：

3.根据权利要求2所述的方法，其中，所述响应于确定所述回复为与所述候选查询不相匹配的错误回复包括：

4.根据权利要求1、2或3所述的方法，其中，所述根据各目标查询，分别构建出对应的训练样本包括：

5.根据权利要求4所述的方法，其中，

6.根据权利要求5所述的方法，其中，

7.根据权利要求1、2或3所述的方法，还包括：

8.一种大模型优化训练方法，包括：

9.根据权利要求8所述的方法，...

【技术特征摘要】

1.一种训练样本获取方法，包括：

2.根据权利要求1所述的方法，其中，所述从所述候选查询中筛选出目标查询包括：

3.根据权利要求2所述的方法，其中，所述响应于确定所述回复为与所述候选查询不相匹配的错误回复包括：

4.根据权利要求1、2或3所述的方法，其中，所述根据各目标查询，分别构建出对应的训练样本包括：

5.根据权利要求4所述的方法，其中，

6.根据权利要求5所述的方法，其中，

7.根据权利要求1、2或3所述的方法，还包括：

8.一种大模型优化训练方法，包括：

9.根据权利要求8所述的方法，其中，

10.根据权利要求8或9所述的方法，还包括：

11.一种训练样本获取装置，包括：查询挖掘模块、问题发现模块和样本构建模块；

12.根据权利要求11所述的装置，其中，...

【专利技术属性】
技术研发人员：冯知凡，吴华，佘俏俏，吴甜，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人