一种问句生成的方法、系统及存储介质技术方案

技术编号：36086187 阅读：14 留言：0更新日期：2022-12-24 11:01

本申请公开了一种问句生成的方法、系统及存储介质。该方法基于知识信息，利用问句生成模型生成问句。基于问句生成模型生成的问句，通过判别系统获得判别结果及问句知识信息对，通过判别系统对判别结果运算，获得目标奖励。然后所述判别系统将问句知识信息对和目标奖励返回给问句生成模型；以返回给所述问句生成模型中的问句知识信息对中对应的目标奖励符合预设要求的问句知识信息对作为训练数据，基于所述训练数据，通过强化学习的方式对问句生成模型进行训练，对问句生成模型进行更新以生成新的问句。在本申请中还公开了一种问句生成的系统及存储介质。在本申请实施例中，实现了问句的生成。问句的生成。问句的生成。

全部详细技术资料下载

【技术实现步骤摘要】
一种问句生成的方法、系统及存储介质

[0001]本申请涉及计算机应用领域，特别涉及一种问句生成的方法、系统及存储介质。

技术介绍

[0002]由于机器阅读理解(Machine Reading Comprehension,MRC)和智能问答系统的蓬勃发展，问句生成受到了越来越广泛的关注。问句生成(Question Generation)是文本生成中的重要子任务，旨在根据输入数据(文本、知识库、图像等类型)生成与输入相关且自然流畅的问句。由此问句生成模型应运而生，利用问句生成模型可以为问答系统提供更多的训练数据，降低人工标注成本，提升系统的性能。
[0003]在问答系统的训练阶段，训练数据越丰富质量越好，但是一般情况下数据不易获取，缺少有效数据。

技术实现思路

[0004]有鉴于此，本申请实施例提供了一种问句生成的方法、系统及存储介质，旨在实现生成一种问句，以用来作为问答系统模型的有效训练数据对问答系统进行训练。
[0005]第一方面，本申请实施例提供了一种问句生成的方法，所述方法包括：
[0006]基于知识信息，利用问句生成模型生成问句；
[0007]基于所述问句生成模型生成的问句，通过所述判别系统获得判别结果及问句知识信息对；
[0008]通过所述判别系统对所述判别结果运算，获得目标奖励；
[0009]所述判别系统将所述问句知识信息对和所述目标奖励返回给问句生成模型；
[0010]以返回给所述问句生成模型中的问句知识信息对中对应的目标奖励符合预设...

【技术保护点】

【技术特征摘要】
1.一种问句生成的方法，其特征在于，所述方法包括：基于知识信息，利用问句生成模型生成问句；基于所述问句生成模型生成的问句，通过判别系统获得判别结果及问句知识信息对；通过所述判别系统对所述判别结果运算，获得目标奖励；所述判别系统将所述问句知识信息对和所述目标奖励返回给问句生成模型；以返回给所述问句生成模型中的问句知识信息对中对应的目标奖励符合预设要求的问句知识信息对作为训练数据；基于所述训练数据，通过强化学习的方式对问句生成模型进行训练，对问句生成模型进行更新；以更新后的问句生成模型生成新的问句。2.根据权利要求1所述的方法，其特征在于，所述判别系统包括：问答系统、知识库信息
‑
问句相似度模型和语法正误判断模型；所述基于所述问句生成模型生成的问句，通过所述判别系统获得判别结果，具体包括：知识库信息
‑
问句相似度模型通过判断输入所述问句生成模型的知识信息与所述基于问句生成模型生成的问句之间的相似度，获得第一奖励；语法正误判断模型通过判断输入的问句的语法是否正确，获得第二奖励；问答系统查询所述问句生成模型生成的问句对应的答案，通过判断所述答案与知识信息是否匹配，获得第三奖励；所述通过所述判别系统对所述判别结果运算，获得目标奖励，具体包括：根据所述第一奖励、所述第二奖励和所述第三奖励获得目标奖励。3.根据权利要求2所述的方法，其特征在于，所述根据所述第一奖励、所述第二奖励和所述第三奖励获得目标奖励包括：根据所述第一奖励、所述第二奖励和所述第三奖励计算加权平均值，将所述加权平均值作为所述目标奖励。4.根据权利要求1所述的方法，其特征在于，所述知识信息存储于所述问答系统的知识库内，所述知识信息为具有头尾实体且实体间存在确定的联系的一组信息。5.根据权利要求1所述的方法，其特征在于，所述问句包括：所述答案与所述知识信息匹配的问句，或，所述答案与所述知识信息不匹配的问句。6.根据权利要求1所述的方法，其特征...

【专利技术属性】
技术研发人员：张士杰，
申请(专利权)人：太保科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人