问答对抽取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40094879 阅读:22 留言:0更新日期:2024-01-23 16:46
本申请提供一种问答对抽取方法、装置、电子设备及存储介质,所述问答对抽取方法,对目标文档进行文档信息解析后,基于文档信息生成用于指示接收指令的对象从目标文档的文本内容中抽取问答对的第一提示指令,然后将该第一提示指令输入预训练的大语言模型,使得该大语言模型从目标文档的文本内容中提取问答对。该方案借助了预训练的大语言模型强大的自然语言处理能力,由该大语言模型执行对目标文档的问答对提取任务,能够提高问答对抽取效率。并且,大语言模型执行问答对抽取任务不受限于特定规则或模板,其问答对抽取更全面、抽取的问答对更丰富。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种问答对抽取方法、装置、电子设备及存储介质


技术介绍

1、问答对数据是智能客服、知识问答等场景下对执行问答任务的模型进行训练和优化的重要数据。

2、常规的获取问答对数据的方案是人工抽取、基于规则的抽取、基于模板的抽取等。这些方案要么效率低下,要么受限于规则和模板的局限性,抽取不全面。因此,需要一种更加高效的问答对抽取方案,从而能够获取更加全面、丰富的问答对数据。


技术实现思路

1、鉴于上述技术现状,本申请提供一种问答对抽取方法、装置、电子设备及存储介质。

2、根据本申请实施例的第一方面,提供了一种问答对抽取方法,包括:

3、对目标文档进行解析,确定所述目标文档的文档信息,所述文档信息包括文档类型、目录、标题、自然段、关键词和图片中的至少一项;

4、基于所述文档信息生成第一提示指令,所述第一提示指令包括所述文档信息中的至少一项、所述目标文档的文本内容以及问答对提取任务的描述信息,所述问答案对提取任务用于基于所述文档信息,从所述目标文本文档来自技高网...

【技术保护点】

1.一种问答对抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,基于预设的问答对评估规则,对所述问答对进行质量评估,确定对所述问答对的质量评估结果,以及,根据对所述问答对的质量评估结果,对所述问答对进行优化调整,包括:

4.根据权利要求2或3所述的方法,其特征在于,基于预设的问答对评估规则,对所述问答对进行质量评估,确定对所述问答对的质量评估结果,包括:

5.根据权利要求1至3中任意一项所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所...

【技术特征摘要】

1.一种问答对抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求2所述的方法,其特征在于,基于预设的问答对评估规则,对所述问答对进行质量评估,确定对所述问答对的质量评估结果,以及,根据对所述问答对的质量评估结果,对所述问答对进行优化调整,包括:

4.根据权利要求2或3所述的方法,其特征在于,基于预设的问答对评估规则,对所述问答对进行质量评估,确定对所述问答对的质量评估结果,包括:

5.根据权利要求1至3中任意一项所述的方法,其特征在于,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,基于所述问答对以及所述目标文档的文本内容,生成与所述问答对中的问题对应的相似问题,以及,对所述问答对以及所述相似问题进行规整,得到规整后的问答对,包括:

7.根据权利要求1至3中任意一项所述的方法,其特征在于,所述方...

【专利技术属性】
技术研发人员:吴昆凡年会潘青华王金钖程彩锋
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1