System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 问答对的生成方法、计算机设备及存储介质技术_技高网

问答对的生成方法、计算机设备及存储介质技术

技术编号:40558465 阅读:8 留言:0更新日期:2024-03-05 19:20
本申请公开了一种问答对的生成方法、计算机设备及存储介质。该方法包括:获取预设文档,预设文档中包括至少一个段落,每个段落中包含有文本描述内容;基于对预设文档划分的段落,选取至少一个段落作为一个目标分段;其中,目标分段中包括目标段落;利用目标分段包含的文本描述内容和关键词信息,获取目标段落对应的问题信息和回答信息;利用目标段落对应的问题信息和回答信息,得到预设文档的一组问答对。上述方案,能够提高获取问答对的效率。

【技术实现步骤摘要】

本申请涉及智能问答,特别是涉及一种问答对的生成方法、计算机设备及存储介质


技术介绍

1、随着问答技术广泛应用于智能客服,智能机器人以及智能音箱等多个领域,用户对于智能问答的需求日渐高涨,智能问答以一问一答的形式,精确定位用户的提问,通过与用户交互,为用户提供个性化的信息服务。

2、目前,在建立问答知识库时,通常采用人工整理的方式抽取问答对,例如通过人工的方式从文档记载的内容中提取出具备问答关系的问句和答句,以生成问答对,以组建问答知识库。

3、然而,采用上述方法需要耗费大量的人力且耗时较长,导致问答对的生成效率低。


技术实现思路

1、本申请主要解决的技术问题是提供一种问答对的生成方法、计算机设备及存储介质,能够减少对人工的依赖,并提高获取问答对的效率。

2、为了解决上述问题,本申请第一方面提供了一种问答对的生成方法,该方法包括:获取预设文档,预设文档中包括至少一个段落,每个段落中包含有文本描述内容;基于对预设文档划分的段落,选取至少一个段落作为一个目标分段;其中,目标分段中包括目标段落;利用目标分段包含的文本描述内容和关键词信息,获取目标段落对应的问题信息和回答信息;利用目标段落对应的问题信息和回答信息,得到预设文档的一组问答对。

3、为了解决上述问题,本申请第二方面提供了一种计算机设备,该计算机设备包括相互耦接的存储器和处理器,存储器中存储有程序数据,处理器用于执行程序数据以实现上述问答对的生成方法的任一步骤。

4、为了解决上述问题,本申请第三方面提供了一种计算机可读存储介质,该计算机可读存储介质存储有能够被处理器运行的程序数据,程序数据用于实现上述问答对的生成方法的任一步骤。

5、本申请上述方案的有益效果是:通过获取预设文档,基于对预设文档划分的段落,选取至少一个段落作为一个目标分段,且目标分段中包括目标段落,利用目标分段包含的文本描述内容和关键词信息,获取目标段落对应的问题信息和回答信息,利用目标段落对应的问题信息和回答信息,得到预设文档的一组问答对,可以用于问答服务,避免采用人工整理的方式抽取问答对所消耗的时长,从而能够提高获取问答对的效率;此外,上述方式能够对多种类型的文档实现自动生成问答对,可以将目标分段中具有意义的段落或目标段落中有意义的句子作为回答信息,可以节省大量人工标注所消耗的时长;并且融合关键词信息在目标分段进行问答对抽取,可以避免出现抽取多通用问答对,提高抽取的问答对的准确率。

本文档来自技高网...

【技术保护点】

1.一种问答对的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述利用所述目标分段包含的文本描述内容和关键词信息,获取所述目标段落对应的问题信息和回答信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述利用所述目标段落包含的文本描述内容和关键词信息,获取所述目标段落对应的问题信息,包括:

4.根据权利要求2所述的方法,其特征在于,所述基于所述问题信息和所述目标分段包含的文本描述内容,获取所述目标段落对应的回答信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述问题信息是基于所述目标段落与关键词信息得到的,所述回答信息是基于所述目标分段与所述问题信息得到的;

6.根据权利要求1所述的方法,其特征在于,所述基于对所述预设文档划分的段落,选取至少一个段落作为一个目标分段,包括:

7.根据权利要求6所述的方法,其特征在于,所述预设文档为具有预设规范排布的文档,所述预设规范排布包括按照层级分布、具有多个层级分布的层级标题、每个所述层级标题下包含有文本描述内容、说明方式排布中的至少一种;

8.根据权利要求1所述的方法,其特征在于,所述获取预设文档之后,还包括:

9.一种计算机设备,其特征在于,包括相互耦接的存储器和处理器,所述存储器中存储有程序数据,所述处理器用于执行所述程序数据以实现权利要求1至8任一项所述方法的步骤。

10.一种计算机可读存储介质,其特征在于,存储有能够被处理器运行的程序数据,所述程序数据用于实现权利要求1至8任一项所述方法的步骤。

...

【技术特征摘要】

1.一种问答对的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述利用所述目标分段包含的文本描述内容和关键词信息,获取所述目标段落对应的问题信息和回答信息,包括:

3.根据权利要求2所述的方法,其特征在于,所述利用所述目标段落包含的文本描述内容和关键词信息,获取所述目标段落对应的问题信息,包括:

4.根据权利要求2所述的方法,其特征在于,所述基于所述问题信息和所述目标分段包含的文本描述内容,获取所述目标段落对应的回答信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述问题信息是基于所述目标段落与关键词信息得到的,所述回答信息是基于所述目标分段与所述问题信息得到的;

6.根据权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:徐睿峰丁可阳王乾龙李建新石国忠胡斐然江万国
申请(专利权)人:招商证券股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1