问答对生成方法、装置、设备及存储介质制造方法及图纸

技术编号:30403862 阅读:16 留言:0更新日期:2021-10-20 10:57
本申请提供了一种问答对生成方法、装置、设备及存储介质。本申请实施例在生成某一个领域的问答对时,首先采用语义分类的方式对收集到的问题进行分类,得到两个问题集合;然后,针对这两个问题集合中的问题分别进行不同的处理,最终基于该领域的关键词组和数据库,生成了与这两个问题集合匹配的两类问答对。该种对问题进行分类处理的方式,能够有针对性地生成高质量的问答对;另外,由于生成问答对的过程基本实现了全自动化,因此极大提高了问答对的生成效率,能够快速完成新建任意领域的问答库的任务或对已有问答库进行补充挖掘的任务。的任务或对已有问答库进行补充挖掘的任务。的任务或对已有问答库进行补充挖掘的任务。

【技术实现步骤摘要】
问答对生成方法、装置、设备及存储介质


[0001]本申请涉及人工智能
,特别涉及一种问答对生成方法、装置、设备及存储介质。

技术介绍

[0002]随着科技的发展,人工智能在众多领域起到了越来越重要的作用。智能交互是人工智能的一个重要领域,用户可以与具有智能交互功能的智能设备之间实现问答对话。例如,用户通过对智能设备进行文字输入、语音输入或图片输入等操作,向智能设备提出问题,然后智能设备基于接收到的问题,从问答库中查找到用户需要的答案,将答案以文字、语音或图片等形式反馈给用户。
[0003]目前,在构建问答库时,问答对的生成方法主要是针对某一特定领域,组织人力进行头脑风暴的问答对编写工作,然而,采用这种方法需要耗费大量的人力且耗时较长,导致问答对的生成效率低。

技术实现思路

[0004]本申请实施例提供了一种问答对生成方法、装置、设备及存储介质,提高了问答对的生成效率。该技术方案如下:
[0005]一方面,提供了一种问答对生成方法,该方法包括:
[0006]获取目标问题集合,对该目标问题集合中的各个问题进行语义分类,得到第一问题集合和第二问题集合,该第一问题集合与数据库中已有问题的提问内容相似,该第二问题集合与该已有问题的提问内容不相似,该数据库用于存储目标领域的问答对;
[0007]对于该第一问题集合中的第一问题,从该数据库中获取第一候选问题集合;基于该第一候选问题集合生成第一问答对;其中,该第一问题与该第一候选问题集合的提问内容相似;
[0008]对于该第二问题集合中的第二问题,基于该目标领域的关键词组,从该第二问题集合中获取第二候选问题集合;基于该第二候选问题集合生成第二问答对。
[0009]另一方面,提供了一种问答对生成装置,该装置包括:
[0010]获取模块,用于获取目标问题集合,对该目标问题集合中的各个问题进行语义分类,得到第一问题集合和第二问题集合,该第一问题集合与数据库中已有问题的提问内容相似,该第二问题集合与该已有问题的提问内容不相似,该数据库用于存储目标领域的问答对;
[0011]第一问答对生成模块,用于对于该第一问题集合中的第一问题,从该数据库中获取第一候选问题集合;基于该第一候选问题集合生成第一问答对;其中,该第一问题与该第一候选问题集合的提问内容相似;
[0012]第二问答对生成模块,用于对于该第二问题集合中的第二问题,基于该目标领域的关键词组,从该第二问题集合中获取第二候选问题集合;基于该第二候选问题集合生成
第二问答对。
[0013]在一种可选地实现方式中,该第一问答对生成模块用于:
[0014]显示第一页面,该第一页面上包括该第一候选问题集合;
[0015]响应于针对该第一候选问题集合中第一候选问题的选中操作,从该数据库中获取与该第一候选问题匹配的第一候选答案;
[0016]基于该第一问题和该第一候选答案,生成第一问答对。
[0017]在一种可选地实现方式中,该第二问答对生成模块用于:
[0018]显示第二页面,该第二页面上包括该第二候选问题集合;
[0019]响应于针对该第二候选问题集合中第二候选问题的选中操作,调用筛选接口,从第三方获取与该第二候选问题匹配的第二候选答案;
[0020]基于该第二候选问题和该第二候选答案,生成该第二问答对。
[0021]在一种可选地实现方式中,该第二问答对生成模块用于:
[0022]显示第二页面,该第二页面上包括该第一候选问题集合;
[0023]响应于针对该第二候选问题集合中第二候选问题的选中操作,将输入的答案编辑内容作为与该第二候选问题匹配的第二候选答案;
[0024]基于该第二候选问题和该第二候选答案,生成第二问答对。
[0025]在一种可选地实现方式中,该获取模块用于:
[0026]基于该目标领域的线上日志,获取该目标问题集合;
[0027]对于该目标问题集合中的任意一个问题,获取该任意一个问题与该已有问题之间的语义相似度;
[0028]响应于获取到的语义相似度处于第一区间,将该任意一个问题添加到该第一问题集合中;
[0029]响应于获取到的语义相似度处于第二区间,将该任意一个问题添加到该第二问题集合中。
[0030]在一种可选地实现方式中,该第一问答对生成模块用于:
[0031]基于该第一问题,从该数据库中获取第三候选问题集合;其中,该第一问题与该第三候选问题集合的提问内容相似;
[0032]获取该第一问题与该第三候选问题集合中各个问题之间的语义相似度;对获取到的语义相似度进行由大到小的排序;
[0033]根据该语义相似度排序在前N位的问题,生成该第一候选问题集合,N为正整数。
[0034]在一种可选地实现方式中,该第二问答对生成模块包括:
[0035]第一获取单元,用于获取该目标领域的关键词组;
[0036]第二获取单元,用于基于该关键词组,从该第二问题集合中获取第四候选问题集合;
[0037]筛选单元,用于调用筛选接口,筛选该第四候选问题集合中满足目标条件的问题;
[0038]生成单元,用于根据该第四候选问题集合中满足该目标条件的问题,生成该第二候选问题集合。
[0039]在一种可选地实现方式中,该第一获取单元用于:
[0040]在该数据库中确定候选词组,获取该候选词组中各个词语的词频;
[0041]根据该各个词语的词频,在该候选词组中确定候选词;
[0042]将该候选词组中包括该候选词的候选词组,作为该关键词组。
[0043]在一种可选地实现方式中,对于该第四候选问题集合中的任意一个问题,该目标条件包括以下任意一项:
[0044]该任意一个问题出现在第五候选问题集合中,其中,该第五候选问题集合是基于该筛选接口获取到的;
[0045]基于该筛选接口获取到该任意一个问题的答案;
[0046]基于该筛选接口获取到第六候选问题集合,该任意一个问题与该第六候选问题集合的提问内容相似。
[0047]在一种可选地实现方式中,该装置还包括:
[0048]存储模块,用于将该第一问答对和该第二问答对存储至该数据库。
[0049]在一种可选地实现方式中,该装置还包括:
[0050]训练模块,用于基于训练语料对问题分类模型进行训练,该训练语料中包括该第一问答对和该第二问答对,该问题分类模型用于对问题进行语义分类。
[0051]另一方面,提供了一种计算机设备,该计算机设备包括处理器和存储器,该存储器用于存储至少一条计算机程序,该至少一段计算机程序由该处理器加载并执行以实现本申请实施例中的问答对生成方法中所执行的操作。
[0052]另一方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条计算机程序,该至少一条计算机程序由处理器加载并执行以实现如本申请实施例中问答对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答对生成方法,其特征在于,所述方法包括:获取目标问题集合,对所述目标问题集合中的各个问题进行语义分类,得到第一问题集合和第二问题集合,所述第一问题集合与数据库中已有问题的提问内容相似,所述第二问题集合与所述已有问题的提问内容不相似,所述数据库用于存储目标领域的问答对;对于所述第一问题集合中的第一问题,从所述数据库中获取第一候选问题集合;基于所述第一候选问题集合生成第一问答对;其中,所述第一问题与所述第一候选问题集合的提问内容相似;对于所述第二问题集合中的第二问题,基于所述目标领域的关键词组,从所述第二问题集合中获取第二候选问题集合;基于所述第二候选问题集合生成第二问答对。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一候选问题集合生成第一问答对,包括:显示第一页面,所述第一页面上包括所述第一候选问题集合;响应于针对所述第一候选问题集合中第一候选问题的选中操作,从所述数据库中获取与所述第一候选问题匹配的第一候选答案;基于所述第一问题和所述第一候选答案,生成所述第一问答对。3.根据权利要求1所述的方法,其特征在于,所述基于所述第二候选问题集合生成第二问答对,包括:显示第二页面,所述第二页面上包括所述第二候选问题集合;响应于针对所述第二候选问题集合中第二候选问题的选中操作,调用筛选接口,从第三方获取与所述第二候选问题匹配的第二候选答案;基于所述第二候选问题和所述第二候选答案,生成所述第二问答对。4.根据权利要求1所述的方法,其特征在于,所述基于所述第二候选问题集合生成第二问答对,包括:显示第二页面,所述第二页面上包括所述第一候选问题集合;响应于针对所述第二候选问题集合中第二候选问题的选中操作,将输入的答案编辑内容作为与所述第二候选问题匹配的第二候选答案;基于所述第二候选问题和所述第二候选答案,生成所述第二问答对。5.根据权利要求1所述的方法,其特征在于,所述获取目标问题集合,对所述目标问题集合中的各个问题进行语义分类,得到第一问题集合和第二问题集合,包括:基于所述目标领域的线上日志,获取所述目标问题集合;对于所述目标问题集合中的任意一个问题,获取所述任意一个问题与所述已有问题之间的语义相似度;响应于获取到的语义相似度处于第一区间,将所述任意一个问题添加到所述第一问题集合中;响应于获取到的语义相似度处于第二区间,将所述任意一个问题添加到所述第二问题集合中。6.根据权利要求1所述的方法,其特征在于,所述从所述数据库中获取第一候选问题集合,包括:基于所述第一问题,从所述数据库中获取第三候选问题集合;其中,所述第一问题与所
述第三候选问题集合的提问内容相似;获取所述第一问题与所述第三候选问题集合中各个问题之间的语义相似度;对获取到的语义相似度进行由大到小的排序;根据所述语义相似度排序在前N位的问题,生成所述第一候选问题集合,N为正整数。7.根据权利要求1所述的方法,其特征在于,所述基于所述目标领域的关键词组,从所述第二问题集合中获取第二候选问题集合,包括:获取所述目标领...

【专利技术属性】
技术研发人员:周辉阳
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1