问句生成方法及装置制造方法及图纸

技术编号:37542680 阅读:16 留言:0更新日期:2023-05-12 16:11
本说明书实施例提供问句生成方法及装置,其中所述问句生成方法包括:获取待处理文本和目标答案;将所述待处理文本和所述目标答案输入至问句生成模型,获得所述问句生成模型输出的初始问句,其中,所述问句生成模型用于生成所述待处理文本和所述目标答案对应的至少一个目标问句;提取所述初始问句对应的初始问句模板;根据所述初始问句模板确定至少一个目标候选问句模板;将至少一个待输入文本输入至所述问句生成模型,获得所述问句生成模型输出的至少一个目标问句,其中,待输入文本基于所述至少一个目标候选问句模板、所述待处理文本和所述目标答案构建。实现了可以对非结构化的待处理文本进行处理的同时,提高目标问句的多样性和准确性。性和准确性。性和准确性。

【技术实现步骤摘要】
问句生成方法及装置


[0001]本说明书实施例涉及人工智能
,特别涉及问句生成方法。

技术介绍

[0002]随着科学技术的发展,人们的生活水平逐渐提高,人工智能化服务也应用于人们的实际生活中,影响着人们的生活。在目前的各个应用领域中,问句知识挖掘技术也逐渐被应用于各个不同的
中,问句知识挖掘技术可以极大地加速智能问答型服务在智能化落地的进程。
[0003]目标的各种应用场景中,大都是以单个句子或者对话流作为输入源,直接以非结构化的文档数据为源头进行智能化问句知识挖掘的实现几乎没有。且仅以单个的句子或是对话流作为输入源,生成的问句会比较单一,因此,如何将非结构化的文档数据作为问句知识挖掘的输入源进行处理,并提高问句多样性是一个非常值得关注的技术问题。

技术实现思路

[0004]有鉴于此,本说明书实施例提供了问句生成方法。本说明书一个或者多个实施例同时涉及问句生成装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序,以解决现有技术中存在的技术缺陷。
[0005]根据本说明书实施例的第一方面,提供了一种问句生成方法,包括:获取待处理文本和目标答案;将所述待处理文本和所述目标答案输入至问句生成模型,获得所述问句生成模型输出的初始问句,其中,所述问句生成模型用于生成所述待处理文本和所述目标答案对应的至少一个目标问句;提取所述初始问句对应的初始问句模板;根据所述初始问句模板确定至少一个目标候选问句模板;将至少一个待输入文本输入至所述问句生成模型,获得所述问句生成模型输出的至少一个目标问句,其中,待输入文本基于所述至少一个目标候选问句模板、所述待处理文本和所述目标答案构建。
[0006]根据本说明书实施例的第二方面,提供了一种问句生成装置,包括:获取模块,被配置为获取待处理文本和目标答案;第一输入模块,被配置为将所述待处理文本和所述目标答案输入至问句生成模型,获得所述问句生成模型输出的初始问句,其中,所述问句生成模型用于生成所述待处理文本和所述目标答案对应的至少一个目标问句;提取模块,被配置为提取所述初始问句对应的初始问句模板;确定模块,被配置为根据所述初始问句模板确定至少一个目标候选问句模板;第二输入模块,被配置为将至少一个待输入文本输入至所述问句生成模型,获得所述问句生成模型输出的至少一个目标问句,其中,待输入文本基于所述至少一个目标候
选问句模板、所述待处理文本和所述目标答案构建。
[0007]根据本说明书实施例的第三方面,提供了另一种问句生成方法,应用于智能问答场景,包括:获取待处理问答文本和目标答案;将所述待处理问答文本和所述目标答案输入至问句生成模型,获得所述问句生成模型输出的初始问答问句,其中,所述问句生成模型用于生成所述待处理问答文本和所述目标答案对应的至少一个目标问答问句;提取所述初始问答问句对应的初始问答问句模板;根据所述初始问答问句模板确定至少一个目标候选问答问句模板;将至少一个待输入问答文本输入至所述问句生成模型,获得所述问句生成模型输出的至少一个目标问答问句,其中,待输入问答文本基于所述至少一个目标候选问答问句模板、所述待处理问答文本和所述目标答案构建。
[0008]根据本说明书实施例的第四方面,提供了另一种问句生成装置,应用于智能问答场景,包括:文本获取模块,被配置为获取待处理问答文本和目标答案;第一文本输入模块,被配置为将所述待处理问答文本和所述目标答案输入至问句生成模型,获得所述问句生成模型输出的初始问答问句,其中,所述问句生成模型用于生成所述待处理问答文本和所述目标答案对应的至少一个目标问答问句;模板提取模块,被配置为提取所述初始问答问句对应的初始问答问句模板;模板确定模块,被配置为根据所述初始问答问句模板确定至少一个目标候选问答问句模板;第二文本输入模块,被配置为将至少一个待输入问答文本输入至所述问句生成模型,获得所述问句生成模型输出的至少一个目标问答问句,其中,待输入问答文本基于所述至少一个目标候选问答问句模板、所述待处理问答文本和所述目标答案构建。
[0009]根据本说明书实施例的第五方面,提供了一种计算设备,包括:存储器和处理器;所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令,该计算机可执行指令被处理器执行时实现上述问句生成方法的步骤。
[0010]根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现上述问句生成方法的步骤。
[0011]根据本说明书实施例的第七方面,提供了一种计算机程序,其中,当所述计算机程序在计算机中执行时,令计算机执行上述问句生成方法的步骤。
[0012]本说明书提供的一种问句生成方法,包括:获取待处理文本和目标答案;将所述待处理文本和所述目标答案输入至问句生成模型,获得所述问句生成模型输出的初始问句,其中,所述问句生成模型用于生成所述待处理文本和所述目标答案对应的至少一个目标问句;提取所述初始问句对应的初始问句模板;根据所述初始问句模板确定至少一个目标候选问句模板;将至少一个待输入文本输入至所述问句生成模型,获得所述问句生成模型输出的至少一个目标问句,其中,待输入文本基于所述至少一个目标候选问句模板、所述待处理文本和所述目标答案构建。
[0013]本说明书一个实施例通过获取待处理文本和答案,并对待处理文本和答案进行处理,实现了可以使非结构化的文档数据作为输入源进行处理,并通过基于提取问句生成模型输出的初始问句的初始问句模板获得至少一个目标候选问句模板,进而基于至少一个目标候选问句模板和待处理文本、目标答案获取与待处理文本和目标答案对应的至少一个目标问句,从而提高生成的目标问句的多样性和准确性。
附图说明
[0014]图1是本说明书一个实施例提供的一种问句生成方法的应用过程示意图;图2是本说明书一个实施例提供的一种问句生成方法的流程图;图3是本说明书一个实施例提供的一种问句生成方法的训练过程示意图;图4是本说明书一个实施例提供的一种问句生成方法的处理过程流程图;图5是本说明书一个实施例提供的一种问句生成装置的结构示意图;图6是本说明书一个实施例提供的另一种问句生成方法的流程图;图7是本说明书一个实施例提供的另一种问句生成装置的结构示意图;图8是本说明书一个实施例提供的一种计算设备的结构框图。
具体实施方式
[0015]在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0016]在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问句生成方法,包括:获取待处理文本和目标答案;将所述待处理文本和所述目标答案输入至问句生成模型,获得所述问句生成模型输出的初始问句,其中,所述问句生成模型用于生成所述待处理文本和所述目标答案对应的至少一个目标问句;提取所述初始问句对应的初始问句模板;根据所述初始问句模板确定至少一个目标候选问句模板;将至少一个待输入文本输入至所述问句生成模型,获得所述问句生成模型输出的至少一个目标问句,其中,待输入文本基于所述至少一个目标候选问句模板、所述待处理文本和所述目标答案构建。2.如权利要求1所述的方法,提取所述初始问句对应的初始问句模板,包括:识别所述初始问句中的至少一个命名实体;将所述至少一个命名实体从所述初始问句中剔除,获得所述初始问句对应的初始问句模板。3.如权利要求1所述的方法,根据所述初始问句模板确定至少一个目标候选问句模板,包括:基于所述初始问句模板在问句模板数据库中进行检索,获得初始候选问句模板集合;对所述初始候选问句模板集合中的初始候选问句模板进行去重处理,获得所述至少一个目标候选问句模板。4.如权利要求3所述的方法,对所述初始候选问句模板集合中的初始候选问句模板进行去重处理,获得所述至少一个目标候选问句模板,包括:将各个初始候选问句模板转换为对应的初始候选问句模板特征矩阵;对所述各个初始候选问句模板特征矩阵进行聚类,获得至少一个初始聚类簇;确定各个初始聚类簇对应的目标候选问句模板特征矩阵;将各个目标候选问句模板特征矩阵对应的初始候选问句模板确定为目标候选问句模板。5.如权利要求4所述的方法,确定各个初始聚类簇对应的目标候选问句模板特征矩阵,包括:确定待处理初始聚类簇,并获取所述待处理初始聚类簇中的初始候选问句模板特征矩阵;获取各个初始候选问句模板特征矩阵对应的检索分数,其中,所述检索分数是所述初始候选问句模板与所述初始问句模板之间的相似度评分;根据所述各个初始候选问句模板特征矩阵对应的检索分数,确定所述待处理初始聚类簇对应的目标候选问句模板特征矩阵。6.如权利要求1所述的方法,所述问句生成模型通过下述方法训练获得:获取第一样本训练数据,其中,所述第一样本训练数据包括第一样本问句、第一样本处理文本和第一样本答案;提取所述第一样本问句对应的第一样本问句模板;根据所述第一样本问句模板确定至少一个样本目标候选问句模板;
将至少一个样本待输入文本输入至初始问句生成模型,获得所述初始问句生成模型输出的至少一个初始预测问句,其中,样本待输入文本基于所述至少一个样本目标候选问句模板、所述第一样本处理文本和所述第一样本答案构建;基于各个初始预测问句、所述第一样本处理文本和所述第一样本答案获取至少一个奖励值,并根据所述第一样本处理文本、所述第一样本答案、所述至少一个样本目标候选问句模板和所述至少一个奖励值训练所述初始问句生成模型,获得所述问句生成模型,其中,所述奖励值用于表征所述各个初始预测问句和所述第一样本答案之间的匹配结果。7...

【专利技术属性】
技术研发人员:苟琪夏泽华李晶阳余海洋黄非李永彬
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1