一种问句生成的方法、系统及存储介质技术方案

技术编号:36086187 阅读:14 留言:0更新日期:2022-12-24 11:01
本申请公开了一种问句生成的方法、系统及存储介质。该方法基于知识信息,利用问句生成模型生成问句。基于问句生成模型生成的问句,通过判别系统获得判别结果及问句知识信息对,通过判别系统对判别结果运算,获得目标奖励。然后所述判别系统将问句知识信息对和目标奖励返回给问句生成模型;以返回给所述问句生成模型中的问句知识信息对中对应的目标奖励符合预设要求的问句知识信息对作为训练数据,基于所述训练数据,通过强化学习的方式对问句生成模型进行训练,对问句生成模型进行更新以生成新的问句。在本申请中还公开了一种问句生成的系统及存储介质。在本申请实施例中,实现了问句的生成。问句的生成。问句的生成。

【技术实现步骤摘要】
一种问句生成的方法、系统及存储介质


[0001]本申请涉及计算机应用领域,特别涉及一种问句生成的方法、系统及存储介质。

技术介绍

[0002]由于机器阅读理解(Machine Reading Comprehension,MRC)和智能问答系统的蓬勃发展,问句生成受到了越来越广泛的关注。问句生成(Question Generation)是文本生成中的重要子任务,旨在根据输入数据(文本、知识库、图像等类型)生成与输入相关且自然流畅的问句。由此问句生成模型应运而生,利用问句生成模型可以为问答系统提供更多的训练数据,降低人工标注成本,提升系统的性能。
[0003]在问答系统的训练阶段,训练数据越丰富质量越好,但是一般情况下数据不易获取,缺少有效数据。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种问句生成的方法、系统及存储介质,旨在实现生成一种问句,以用来作为问答系统模型的有效训练数据对问答系统进行训练。
[0005]第一方面,本申请实施例提供了一种问句生成的方法,所述方法包括:
[0006]基于知识信息,利用问句生成模型生成问句;
[0007]基于所述问句生成模型生成的问句,通过所述判别系统获得判别结果及问句知识信息对;
[0008]通过所述判别系统对所述判别结果运算,获得目标奖励;
[0009]所述判别系统将所述问句知识信息对和所述目标奖励返回给问句生成模型;
[0010]以返回给所述问句生成模型中的问句知识信息对中对应的目标奖励符合预设要求的问句知识信息对作为训练数据;
[0011]基于所述训练数据,通过强化学习的方式对问句生成模型进行训练,对问句生成模型进行更新;
[0012]以更新后的问句生成模型生成新的问句。
[0013]可选的,所述判别系统包括:
[0014]问答系统、知识库信息

问句相似度模型和语法正误判断模型;
[0015]所述基于所述问句生成模型生成的问句,通过所述判别系统获得判别结果,具体包括:
[0016]知识库信息

问句相似度模型通过判断输入所述问句生成模型的知识信息与所述基于问句生成模型生成的问句之间的相似度,获得第一奖励;
[0017]语法正误判断模型通过判断输入的问句的语法是否正确,获得第二奖励;
[0018]问答系统查询所述问句生成模型生成的问句对应的答案,通过判断所述答案与知识信息是否匹配,获得第三奖励;
[0019]所述通过所述判别系统对所述判别结果运算,获得目标奖励,具体包括:
[0020]根据所述第一奖励、所述第二奖励和所述第三奖励获得目标奖励。
[0021]可选的,所述根据所述第一奖励、所述第二奖励和所述第三奖励获得目标奖励包括:
[0022]根据所述第一奖励、所述第二奖励和所述第三奖励计算加权平均值,将所述加权平均值作为所述目标奖励。
[0023]可选的,所述知识信息存储于所述问答系统的知识库内,所述知识信息为具有头尾实体且实体间存在确定的联系的一组信息。
[0024]可选的,所述问句包括:
[0025]所述答案与所述知识信息匹配的问句,或,所述答案与所述知识信息不匹配的问句。
[0026]可选的,所述符合预设要求的问句知识信息对,包括:
[0027]对应的目标奖励为所述目标奖励的取值范围内的最大值。
[0028]第二方面,本申请实施例提供了一种问句生成的系统,所述系统包括:
[0029]问句生成模型和判别系统,其中判别系统包括问答系统,问答系统包括知识库;
[0030]所述问句生成模型,用于基于知识信息,利用问句生成模型生成问句:
[0031]所述问答系统,用于从所述问句生成模型获取问句,所述问答系统隶属于判别系统;
[0032]所述判别系统,用于基于问句生成模型生成的问句获得判别结果;对所述判别结果运算获得目标奖励,并生成问句知识信息对;将所述问句知识信息对和所述目标奖励返回给问句生成模型;其中,返回给所述问句生成模型中的问句知识信息对中对应的目标奖励符合预设要求的问句知识信息对作为训练数据;
[0033]所述问句生成模型,还用于基于所述训练数据,通过强化学习的方式训练并更新;以更新后的问句生成模型生成新的问句。
[0034]可选的,所述判别系统还包括:
[0035]知识库信息

问句相似度模型和语法正误判断模型;
[0036]所述知识库信息

问句相似度模型,用于通过判断输入所述问句生成模型的知识信息与所述基于问句生成模型生成的问句之间的相似度,获得第一奖励;
[0037]所述语法正误判断模型,用于通过判断输入的问句的语法是否正确,获得第二奖励;
[0038]所述问答系统,用于查询所述问句生成模型生成的问句对应的答案,通过判断所述答案与知识信息是否匹配,获得第三奖励;
[0039]所述判别系统,具体用于:
[0040]根据所述第一奖励、所述第二奖励和所述第三奖励获得目标奖励。
[0041]可选的,所述判别系统具体用于:
[0042]根据所述第一奖励、所述第二奖励和所述第三奖励的加权平均值,将所述加权平均值作为所述目标奖励。
[0043]第三方面,本申请实施例提供了一种计算机存储介质,所述计算机存储介质中存储有代码,当所述代码被运行时,运行所述代码的设备实现前述第一方面任一种实现方式介绍的问句生成的方法。
[0044]本申请提供了一种问句生成的方法、系统及存储介质,在执行所述方法时,首先基于问答系统中的知识库,获取知识库中的完整的知识信息,将知识信息作为答案输入问句生成模型生成问句。将所述问句输入到判别系统根据知识信息得到答案,同时判别系统根据判别结果输出奖励,并生成问句知识信息对。然后将所述问句知识信息对及所述奖励返回给问句生成模型作为训练数据,通过强化学习的方式实现问句生成模型的更新,以使问句生成模型不断生成一种特殊的问句。如此,通过判别系统的判别过程输出的奖励及问句知识信息对,利用强化学习的方式对问句生成模型进行训练,不断生成新的问句及问句知识信息对作为问句生成模型的训练数据,生成的问句与判别系统中查询的答案组成的问句答案对能够作为训练问答系统的有效数据对问答系统进行训练。
附图说明
[0045]为更清楚地说明本实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0046]图1为更新模型生成问句的流程图;
[0047]图2为判断目标奖励是否符合预设要求的流程图;
[0048]图3为问答系统内部的判别的流程图;
[0049]图4为一种问句生成的系统结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问句生成的方法,其特征在于,所述方法包括:基于知识信息,利用问句生成模型生成问句;基于所述问句生成模型生成的问句,通过判别系统获得判别结果及问句知识信息对;通过所述判别系统对所述判别结果运算,获得目标奖励;所述判别系统将所述问句知识信息对和所述目标奖励返回给问句生成模型;以返回给所述问句生成模型中的问句知识信息对中对应的目标奖励符合预设要求的问句知识信息对作为训练数据;基于所述训练数据,通过强化学习的方式对问句生成模型进行训练,对问句生成模型进行更新;以更新后的问句生成模型生成新的问句。2.根据权利要求1所述的方法,其特征在于,所述判别系统包括:问答系统、知识库信息

问句相似度模型和语法正误判断模型;所述基于所述问句生成模型生成的问句,通过所述判别系统获得判别结果,具体包括:知识库信息

问句相似度模型通过判断输入所述问句生成模型的知识信息与所述基于问句生成模型生成的问句之间的相似度,获得第一奖励;语法正误判断模型通过判断输入的问句的语法是否正确,获得第二奖励;问答系统查询所述问句生成模型生成的问句对应的答案,通过判断所述答案与知识信息是否匹配,获得第三奖励;所述通过所述判别系统对所述判别结果运算,获得目标奖励,具体包括:根据所述第一奖励、所述第二奖励和所述第三奖励获得目标奖励。3.根据权利要求2所述的方法,其特征在于,所述根据所述第一奖励、所述第二奖励和所述第三奖励获得目标奖励包括:根据所述第一奖励、所述第二奖励和所述第三奖励计算加权平均值,将所述加权平均值作为所述目标奖励。4.根据权利要求1所述的方法,其特征在于,所述知识信息存储于所述问答系统的知识库内,所述知识信息为具有头尾实体且实体间存在确定的联系的一组信息。5.根据权利要求1所述的方法,其特征在于,所述问句包括:所述答案与所述知识信息匹配的问句,或,所述答案与所述知识信息不匹配的问句。6.根据权利要求1所述的方法,其特征...

【专利技术属性】
技术研发人员:张士杰
申请(专利权)人:太保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1