基于上下文信息的问题生成方法、装置、设备和介质制造方法及图纸

技术编号:41621840 阅读:31 留言:0更新日期:2024-06-13 02:22
本发明专利技术提供一种基于上下文信息的问题生成方法、装置、设备和介质,属于自然语言处理技术领域,其中方法包括:获取初始问题,以及初始问题对应的上下文信息;从预先构建的提示库中选取目标信息提取提示prompt,将目标信息提取prompt和上下文信息输入至第一大语言模型,得到第一大语言模型输出的上下文信息的关键信息;从提示库中选取目标问题进化prompt,将初始问题、关键信息和目标问题进化prompt输入至第二大语言模型,得到第二大语言模型输出的初始问题进化后的问题。本发明专利技术提供的基于上下文信息的问题生成方法、装置、设备和介质能够更有效地生成多样性强、规模大的问题数据集,灵活性和适应性强。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其涉及一种基于上下文信息的问题生成方法、装置、设备和介质


技术介绍

1、大语言模型已经成为许多自然语言处理任务的首选方法。为了训练大语言模型更好地解决问题,需要构造大量的问题样本。目前,采用人工的方式构造问题数据集,成本较高,限制了问题的数量和多样性,采用人工智能的方法基于原始问题生成问题数据集,要求原始问题包含丰富的信息,灵活性差,难以适应多种应用场景。


技术实现思路

1、本专利技术提供一种基于上下文信息的问题生成方法、装置、设备和介质,用以解决现有技术中采用人工的方式构造问题数据集,成本较高,限制了问题的数量和多样性,采用人工智能的方法基于原始问题构造问题数据集,要求原始问题包含丰富的信息,灵活性差,难以适应多种应用场景的缺陷。

2、第一方面,本专利技术提供一种基于上下文信息的问题生成方法,包括:

3、获取初始问题,以及所述初始问题对应的上下文信息;

4、从预先构建的提示库中选取目标信息提取提示prompt,将目标信息提取prompt和所本文档来自技高网...

【技术保护点】

1.一种基于上下文信息的问题生成方法,其特征在于,包括:

2.根据权利要求1所述的基于上下文信息的问题生成方法,其特征在于,所述得到所述第二大语言模型输出的所述初始问题进化后的问题之后,还包括:

3.根据权利要求1所述的基于上下文信息的问题生成方法,其特征在于,所述从所述提示库中选取目标问题进化prompt,包括:

4.根据权利要求3所述的基于上下文信息的问题生成方法,其特征在于,所述多个进化方向包括添加约束、显式推理、具象化、增加查询和创建全新问题。

5.根据权利要求3所述的基于上下文信息的问题生成方法,其特征在于,所述从多个进化方向中确...

【技术特征摘要】

1.一种基于上下文信息的问题生成方法,其特征在于,包括:

2.根据权利要求1所述的基于上下文信息的问题生成方法,其特征在于,所述得到所述第二大语言模型输出的所述初始问题进化后的问题之后,还包括:

3.根据权利要求1所述的基于上下文信息的问题生成方法,其特征在于,所述从所述提示库中选取目标问题进化prompt,包括:

4.根据权利要求3所述的基于上下文信息的问题生成方法,其特征在于,所述多个进化方向包括添加约束、显式推理、具象化、增加查询和创建全新问题。

5.根据权利要求3所述的基于上下文信息的问题生成方法,其特征在于,所述从多个进化方向中确定所述初始问题对应的目标进化方向,包括:

6.根据权利要求1所述的基于上下文信息的问题生成方法,其特征在于,所述从预先构建的提示库中选取...

【专利技术属性】
技术研发人员:徐博张清扬杜佳鸿王燕娜徐波
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1