一种问题生成模型的训练方法及装置制造方法及图纸

技术编号:39185656 阅读:9 留言:0更新日期:2023-10-27 08:33
本说明书一个或多个实施例公开了一种问题生成模型的训练方法,该方法首先获取历史复杂问题及其对应的答案,以及与历史复杂问题对应的历史文档型知识库,且该历史文档型知识库中至少包括一个与历史复杂问题相关的历史文档;然后从历史文档中提取与历史复杂问题相关的实体词,基于实体词构建简单问题,并基于简单问题和历史复杂问题确定多个历史知识点;最后基于历史文档和多个历史知识点,通过预设的损失函数对问题生成模型进行训练,得到训练后的问题生成模型,其中,该问题生成模型用于生成历史文档对应的历史复杂问题。成历史文档对应的历史复杂问题。成历史文档对应的历史复杂问题。

【技术实现步骤摘要】
一种问题生成模型的训练方法及装置


[0001]本文件涉及智能问答
,尤其涉及一种问题生成模型的训练方法及装置。

技术介绍

[0002]智能问答是人机交互领域的重要形式,智能问答系统是一种处理自然语言的新型信息检索系统,采用一问一答的形式,通过接收用户提出的问题,然后精确地定位该问题所涉及到的问答库中的相关知识,并根据设定的业务处理流程进行业务游走,实现业务引导与用户之间的交互,将相关知识作为对该问题的解答反馈给用户,完成智能问答。
[0003]目前的智能问答系统通常只能提出简单问题,例如“你是哪年出生的?”类的问题,这类问题不需要关联推理和思考,由于问题和回答都比较简单,这种简单问题在一些领域就无法满足用户需求,例如:在测谎时,针对简单问题,用户可能会没有异常反应地快速回答,从而无法观察用户反应,使得测谎效果不够准确。因此,目前亟需提供一种能够生成需要一定关联推理和思考的复杂问题的方法。

技术实现思路

[0004]本说明书实施例的目的是提供一种能够智能生成复杂问题,以满足用户需求的技术方案。
[0005]为了实现上述技术方案,本说明书实施例是这样实现的:
[0006]一方面,本说明书一个或多个实施例提供一种问题生成模型的训练方法,包括:获取历史复杂问题及其对应的答案,以及与所述历史复杂问题对应的历史文档型知识库,所述历史文档型知识库中至少包括一个与所述历史复杂问题相关的历史文档;从所述历史文档中提取与所述历史复杂问题相关的实体词,基于所述实体词构建简单问题,并基于所述简单问题和历史复杂问题确定多个历史知识点;基于所述历史文档和多个历史知识点,通过预设的损失函数对问题生成模型进行训练,得到训练后的问题生成模型,所述问题生成模型用于生成所述历史文档对应的历史复杂问题。
[0007]另一方面,本说明书一个或多个实施例提供一种问题生成模型的训练装置,包括:输入模块,获取历史复杂问题及其对应的答案,以及与所述历史复杂问题对应的历史文档型知识库,所述历史文档型知识库中至少包括一个与所述历史复杂问题相关的历史文档;历史知识点确定模块,从所述历史文档中提取与所述历史复杂问题相关的实体词,基于所述实体词构建简单问题,并基于所述简单问题和历史复杂问题确定多个历史知识点;模型训练模块,基于所述历史文档和多个历史知识点,通过预设的损失函数对问题生成模型进行训练,得到训练后的问题生成模型,所述问题生成模型用于生成所述历史文档对应的历史复杂问题。
[0008]再一方面,本说明书一个或多个实施例提供一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,在所述可执行指令被执行时,能够使得所述处理器:获取历史复杂问题及其对应的答案,以及与所述历史复杂问题对应的历史文档型知识
库,所述历史文档型知识库中至少包括一个与所述历史复杂问题相关的历史文档;从所述历史文档中提取与所述历史复杂问题相关的实体词,基于所述实体词构建简单问题,并基于所述简单问题和历史复杂问题确定多个历史知识点;基于所述历史文档和多个历史知识点,通过预设的损失函数对问题生成模型进行训练,得到训练后的问题生成模型,所述问题生成模型用于生成所述历史文档对应的历史复杂问题。
[0009]又一方面,本说明书一个或多个实施例提供本说明书一个或多个实施例提供一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:获取历史复杂问题及其对应的答案,以及与所述历史复杂问题对应的历史文档型知识库,所述历史文档型知识库中至少包括一个与所述历史复杂问题相关的历史文档;从所述历史文档中提取与所述历史复杂问题相关的实体词,基于所述实体词构建简单问题,并基于所述简单问题和历史复杂问题确定多个历史知识点;基于所述历史文档和多个历史知识点,通过预设的损失函数对问题生成模型进行训练,得到训练后的问题生成模型,所述问题生成模型用于生成所述历史文档对应的历史复杂问题。
附图说明
[0010]为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0011]图1是本说明书一种问题生成模型的训练方法的示意性流程图;
[0012]图2是本说明书一种问题生成模型的训练方法的示意性原理图;
[0013]图3是本说明书另一种问题生成模型的训练方法的示意性流程图;
[0014]图4是本说明书又一种问题生成模型的训练方法的示意性流程图;
[0015]图5是本说明书一种问题生成模型的训练装置的示意性框图;
[0016]图6是本说明书一种电子设备的示意性框图。
具体实施方式
[0017]本说明书一个或多个实施例提供一种问题生成模型的训练方法及装置。
[0018]为了使本
的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件保护的范围。
[0019]目前在教育类出题考试时、风控领域进行审理考卷出题时,为了更好地考察回答者的真实水平,通常需要设计一些要求回答者进行一定的关联推理和思考才能完成回答的问题。在智能机器人提问为主的对话场景中,复杂问题提问是一个重要的研究方向,常见的复杂问题生成方式如人工配题库的方式,即:通过人工设计并新增复杂问题,然而,该方式需要设计者大量阅读相关知识,然后编写复杂问题,当知识内容更新后,设计者需要继续投入以更新复杂问题,上述方式生成的复杂问题很容易被用户反复尝试突破(即撞库)。此外,
还有一种自动问答系统AUTOQA,可以生成简单的问题,该自动问答系统主要是使用大量互联网信息进行训练得到。然而,对于所需要的复杂问题,由于复杂问题的场景,互联网没有足够多的语料,因此无法采用自动问答系统进行复杂问题训练。基于此,本说明书实施例提供一种问题生成模型的训练方法及装置,在采用较少复杂问题及其对应答案构成的样本量的情况下,完成模型训练,并达到可用级别,从而大大提升复杂问题生成的效率以及生成效果。下面进行详细说明。
[0020]实施例一
[0021]如图1所示,本说明书实施例提供一种问题生成模型的训练方法。该方法的执行主体可以为终端设备或者服务器。其中,该终端设备可以如:手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑登计算机设备。该服务器可以是独立的一个服务器,还可以是由多个服务器构成的服务器集群等,该服务器可以是某应用程序的后台服务器等。该方法可以包括如下步骤:
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题生成模型的训练方法,包括:获取历史复杂问题及其对应的答案,以及与所述历史复杂问题对应的历史文档型知识库,所述历史文档型知识库中至少包括一个与所述历史复杂问题相关的历史文档;从所述历史文档中提取与所述历史复杂问题相关的实体词,基于所述实体词构建简单问题,并基于所述简单问题和历史复杂问题确定多个历史知识点;基于所述历史文档和多个历史知识点,通过预设的损失函数对问题生成模型进行训练,得到训练后的问题生成模型,所述问题生成模型用于生成所述历史文档对应的历史复杂问题。2.根据权利要求1所述的方法,所述从所述历史文档中提取与所述历史复杂问题相关的实体词,基于所述实体词构建简单问题,并基于所述简单问题和历史复杂问题确定多个历史知识点,包括:确定所述历史文档中与所述历史复杂问题相关的所有实体词,且所述实体词未出现在所述历史复杂问题中;根据每个实体词,确定对应的简单问题,所述简单问题为包含单一关系的问题;通过分别比对每个简单问题与所述历史复杂问题的相似度,从所有实体词中确定所述历史复杂问题对应的历史知识点。3.根据权利要求2所述的方法,所述根据每个实体词,确定对应的简单问题,包括:分别以每个实体词为答案,基于自动问答系统生成每个实体词对应的简单问题。4.根据权利要求2所述的方法,所述通过分别比对每个简单问题与所述历史复杂问题的相似度,从所有实体词中确定所述历史复杂问题对应的历史知识点,包括:通过分别计算每个简单问题与所述历史复杂问题的BLEU值或者分别计算每个所述简单问题与历史复杂问题的最大相同子串字数,得到每个所述简单问题与历史复杂问题的相似度;根据计算得到的相似度,按照设定的相似度阈值,从所有实体词中确定所述历史复杂问题对应的多个历史知识点。5.根据权利要求1或4所述的方法,所述历史复杂问题...

【专利技术属性】
技术研发人员:应缜哲薛兰青吴晓烽王维强
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1