System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 问答数据集生成方法、装置、电子设备及存储介质制造方法及图纸_技高网

问答数据集生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40389861 阅读:6 留言:0更新日期:2024-02-20 22:22
本申请公开了一种问答数据集生成方法、装置、电子设备及存储介质,涉及计算机技术领域;本申请可以获取多个待使用问句;根据待使用问句的问句类型以及预设指令模板,生成待使用问句对应的待交互指令;利用指定模型对待交互指令进行推理,以在指定页面中展示所述待交互指令对应的响应内容;在利用指定模型对待交互指令进行推理的过程中,根据指定页面中的视觉元素,对响应内容进行响应校验;若通过响应校验,将响应内容确定为待交互指令对应的回复内容;根据待交互指令以及待交互指令对应的回复内容,生成问答数据集。利用视觉元素进行响应校验,可及时获知到推理完成的时刻,避免长时间的等待,从而可提升问答数据集的生成效率。

【技术实现步骤摘要】

本申请涉及计算机,具体涉及一种问答数据集生成方法、装置、电子设备及存储介质


技术介绍

1、近年来,随着人工智能技术的快速发展,人们开始依赖人工智能技术完成一些任务或者快速获取知识。例如,通过对神经网络模型的训练,可以使得神经网络模型具备解答用户疑问的能力,人们可直接向神经网络模型进行提问,以快速获取相应的答案。

2、通常,为了使得神经网络模型具备解答用户的疑问的能力,需要使用大量的问答对训练神经网络模型。目前,这些问答对的生成依赖于人工,需要耗费大量的人力和时间,难以快速生成训练神经网络模型所需的问答数据集。


技术实现思路

1、本申请实施例提供一种问答数据集生成方法、装置、电子设备及存储介质,可以有效提升问答数据集的生成效率。

2、本申请实施例提供一种问答数据集生成方法,该方法包括:

3、获取多个待使用问句;

4、根据所述待使用问句的问句类型以及预设指令模板,生成所述待使用问句对应的待交互指令;

5、针对每个所述待交互指令,利用指定模型对所述待交互指令进行推理,以在指定页面中展示所述待交互指令对应的响应内容,其中,所述指定页面为与所述指定模型进行交互的页面;

6、在利用指定模型对所述待交互指令进行推理的过程中,根据所述指定页面中的视觉元素,对所述响应内容进行响应校验;

7、若所述响应内容通过所述响应校验,将所述响应内容确定为所述待交互指令对应的回复内容;

8、根据所述待交互指令以及所述待交互指令对应的回复内容,生成问答数据集。

9、本申请实施例还提供一种问答数据集生成装置,该装置包括:

10、获取模块,用于获取多个待使用问句;

11、指令生成模块,用于根据所述待使用问句的问句类型以及预设指令模板,生成所述待使用问句对应的待交互指令;

12、推理模块,用于针对每个所述待交互指令,利用指定模型对所述待交互指令进行推理,以在指定页面中展示所述待交互指令对应的响应内容,其中,所述指定页面为与所述指定模型进行交互的页面;

13、校验模块,用于在利用指定模型对所述待交互指令进行推理的过程中,根据所述指定页面中的视觉元素,对所述响应内容进行响应校验;

14、确定模块,用于若所述响应内容通过所述响应校验,将所述响应内容确定为所述待交互指令对应的回复内容;

15、数据集生成模块,用于根据所述待交互指令以及所述待交互指令对应的回复内容,生成问答数据集。

16、本申请实施例还提供一种电子设备,包括处理器和存储器,所述存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行本申请实施例所提供的任一种问答数据集生成方法中的步骤。

17、本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行本申请实施例所提供的任一种问答数据集生成方法中的步骤。

18、本申请实施例可以获取到多个待使用问句,并基于待使用问句的类型和预设指令模板,生成待交互指令,利用指定模型对待交互指令进行推理,以在指定页面中展示响应内容,在推理的过程中,利用指定页面中的视觉元素对响应内容进行响应校验,在通过响应校验时,确定响应内容为回复内容,并基于待交互指令和对应的回复内容,生成问答数据集。整个过程全程自动化执行,无需人工干涉,可节约人力,且利用视觉元素进行响应校验,可及时获知到推理完成的时刻,避免长时间的等待,从而可提升问答数据集的生成效率。

本文档来自技高网...

【技术保护点】

1.一种问答数据集生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述视觉元素包括响应区域、响应指示元素和所述响应内容,所述响应内容展示在所述响应区域内,所述响应指示元素用于表征所述响应内容不完整,所述根据所述指定页面中的视觉元素,对所述响应内容进行响应校验,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述响应指示元素确定所述响应内容是否通过响应校验,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述待使用问句的问句类型以及预设指令模板,生成所述待使用问句对应的待交互指令,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述聚类簇以及所述待使用问句对应的预测类型,确定所述待使用问句对应的问句类型,包括:

6.根据权利要求4所述的方法,其特征在于,所述利用指定模型对所述待交互指令进行推理,以在指定页面中展示所述待交互指令对应的响应内容,包括:

7.根据权利要求6所述的方法,其特征在于,所述指定页面包括交互控件以及内容输入框,所述按照所述推理顺序,将所述待交互指令发送至所述指定模型进行推理,并将推理得到的响应内容展示在指定页面中,包括:

8.一种问答数据集生成装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行如权利要求1~7任一项所述的问答数据集生成方法中的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1~7任一项所述的问答数据集生成方法中的步骤。

...

【技术特征摘要】

1.一种问答数据集生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述视觉元素包括响应区域、响应指示元素和所述响应内容,所述响应内容展示在所述响应区域内,所述响应指示元素用于表征所述响应内容不完整,所述根据所述指定页面中的视觉元素,对所述响应内容进行响应校验,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述响应指示元素确定所述响应内容是否通过响应校验,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述待使用问句的问句类型以及预设指令模板,生成所述待使用问句对应的待交互指令,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述聚类簇以及所述待使用问句对应的预测类型,确定所述待使用问句对应的问句类型,包括:

6.根据权利要求4所述...

【专利技术属性】
技术研发人员:周勤民屠静王亚
申请(专利权)人:卓世智星天津科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1