提问信息生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34460443 阅读:16 留言:0更新日期:2022-08-06 17:20
本公开提出了提问信息生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,具体涉及知识图谱、深度学习、自然语言处理等技术领域。具体实现方案为:从结构化知识库中获取至少一组键值对;根据设定的树形结构模板,对所述至少一组键值对进行组合,以得到树形结构;根据树形结构中至少一个条件层中的属性键、属性值和关联关系,生成对应条件层的至少一组词语组合;根据各条件层的至少一组词语组合,以及顶层对应的疑问文本,生成提问信息。由此,基于各条件层的至少一组词语组合,生成提问信息,提高了生成提问信息的灵活性,降低了生成提问信息的生成难度,同时,无需人工标注,降低了人工成本。降低了人工成本。降低了人工成本。

【技术实现步骤摘要】
提问信息生成方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
,具体涉及知识图谱、深度学习、自然语言处理等
,尤其涉及提问信息生成方法、装置、电子设备及存储介质。

技术介绍

[0002]随着自然语言处理技术的发展,出现了问题生成技术。问题生成可为根据结构化知识生成尽可能多的问题技术,问题的生成应用十分广泛,例如,机器知识库可以利用主动提问来构建或者补充知识库、扩充数据集;在教育领域,问题生成可以帮助学生来提问;在对话领域,问题生成可以作为冷启动来开始一个话题,或者通过提问来获得反馈,应用场景非常丰富。

技术实现思路

[0003]本公开提供了一种用于提问信息生成方法、装置、电子设备及存储介质。
[0004]根据本公开的一方面,提供了一种提问信息生成方法,包括:从结构化知识库中获取至少一组键值对;根据设定的树形结构模板,对所述至少一组键值对进行组合,以得到树形结构,其中,所述树形结构中包括用于指示疑问文本的顶层,以及所述顶层下的至少一个条件层,任一所述条件层对应一组键值对中的属性键和属性值以及所述属性键和所述属性值之间的关联关系;根据所述至少一个条件层中的所述属性键、属性值和所述关联关系,生成对应条件层的至少一组词语组合;根据各所述条件层的所述至少一组词语组合,以及所述顶层对应的疑问文本,生成提问信息。
[0005]根据本公开的另一方面,提供了一种提问信息生成装置,包括:获取模块,用于从结构化知识库中获取至少一组键值对;组合模块,用于根据设定的树形结构模板,对所述至少一组键值对进行组合,以得到树形结构,其中,所述树形结构中包括用于指示疑问文本的顶层,以及所述顶层下的至少一个条件层,任一所述条件层对应一组键值对中的属性键和属性值以及所述属性键和所述属性值之间的关联关系;第一生成模块,用于根据所述至少一个条件层中的所述属性键、属性值和所述关联关系,生成对应条件层的至少一组词语组合;第二生成模块,用于根据各所述条件层的所述至少一组词语组合,以及所述顶层对应的疑问文本,生成提问信息。
[0006]根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本公开第一方面实施例所述的提问信息生成方法。
[0007]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本公开第一方面实施例所述的提问信息生成方法。
[0008]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,其中,所
述计算机程序在被处理器执行时实现本公开第一方面实施例所述的提问信息生成方法。
[0009]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0010]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0011]图1为本公开实施例一所提供的提问信息生成方法的流程示意图;
[0012]图2为本公开实施例二所提供的提问信息生成方法的流程示意图;
[0013]图3为本公开实施例三所提供的提问信息生成方法的流程示意图;
[0014]图4为本公开实施例四所提供的提问信息生成方法的流程示意图;
[0015]图5为本公开实施例五所提供的提问信息生成方法的流程示意图;
[0016]图6为本公开实施例六所提供的提问信息生成方法的流程示意图;
[0017]图7为本公开实施例七所提供的提问信息生成方法的流程示意图;
[0018]图8为本公开实施例八所提供的提问信息生成方法的流程示意图;
[0019]图9为本公开实施例所提供的提问信息生成方法的流程示意图;
[0020]图10为本公开实施例所提供的各元素生成对应的同义词语集合的流程示意图;
[0021]图11为本公开实施例所提供的各短语生成同义对应的同义词语集合的流程示意图;
[0022]图12为本公开实施例所提供的各短语组合生成同义句子集合的流程示意图;
[0023]图13为本公开实施例九所提供的提问信息生成装置的结构示意图;
[0024]图14是用来实现本公开实施例的提问信息生成方法的电子设备的框图。
具体实施方式
[0025]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0026]基于结构化知识库的问题生成指的是根据结构化知识生成尽可能多的问题的技术,例如,根据知识三元组<张三、出生时间,1992年>,可以生成“张三什么时候出生的”、“张三出生于哪一年”等很多种问法。复杂问题指的根据多条结构化知识才能生成的问题,例如“出生地是地区A、性别是男、年龄大于50岁的人有哪些”。复杂问题生成是自然语言处理领域的研究热点之一,在实际的行业应用中也发挥着重要作用。问题生成的关键在于如何保证生成的问题和原始知识表达的意思相同,同时怎么才能生成尽可能多样化的问题。
[0027]相关技术中,主要采用以下两种方案进行问题生成,第一种是,基于模板的问题生成技术生成问题,即利用知识库中的元素,基于人工标注的模板进行组合,生成大量的问题;第二种是,基于seq2seq(一种Encoder

Decoder(编码

解码)结构的网络)的生成技术生成问题,即采用类似翻译模型的方式,将结构化知识作为一个序列,输入到seq2seq模型中,通过解码的方式生成另一个文本序列,作为最终生成问题。
[0028]然而,上述第一种方式需要大量人工进行模板标注,模板生成的人工成本较高,尤
其是对复杂的问题,生成模板的标注成本更高,并且生成的问题过于单一;上述第二种方式中基于seq2seq模型生成的问题可能存在语法错误,不符合人类的说话方式,并且生成的问题单一,不便于行业迁移。
[0029]针对上述问题,本公开提出一种提问信息生成方法、装置、电子设备及存储介质。
[0030]下面参考附图描述本公开实施例的提问信息生成方法、装置、电子设备及存储介质。
[0031]图1为本公开实施例一所提供的提问信息生成方法的流程示意图。
[0032]本公开实施例以该提问信息生成方法被配置于提问信息生成装置中来举例说明,该提问信息生成装置可以应用于任一电子设备中,以使该电子设备可以执行提问信息生成功能。
[0033]其中,电子设备可以为任一具有计算能力的设备本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提问信息生成方法,包括:从结构化知识库中获取至少一组键值对;根据设定的树形结构模板,对所述至少一组键值对进行组合,以得到树形结构,其中,所述树形结构中包括用于指示疑问文本的顶层,以及所述顶层下的至少一个条件层,任一所述条件层对应一组键值对中的属性键和属性值以及所述属性键和所述属性值之间的关联关系;根据所述至少一个条件层中的所述属性键、属性值和所述关联关系,生成对应条件层的至少一组词语组合;根据各所述条件层的所述至少一组词语组合,以及所述顶层对应的疑问文本,生成提问信息。2.根据权利要求1所述的方法,其中,所述根据各所述条件层的所述至少一组词语组合,以及所述顶层对应的疑问文本,生成提问信息,包括:在所述条件层为多个的情况下,根据处于底层的条件层的各组所述词语组合,生成至少一条文本片段;对处于所述底层和顶层之间的任一中间条件层,基于处在所述中间条件层之下且邻接的一个条件层所生成的至少一条文本片段,以及所述中间条件层的至少一组词语组合,生成所述中间条件层的至少一条文本片段;根据所述顶层对应的疑问文本,以及处在所述顶层之下且邻接的一个中间条件层所生成的至少一条文本片段,采用端到端的句子生成模型生成所述提问信息。3.根据权利要求1所述的方法,其中,所述根据各所述条件层的所述至少一组词语组合,以及所述顶层对应的疑问文本,生成提问信息,包括:对所述至少一个条件层中的任一条件层,根据所述至少一组词语组合,生成对应条件层的至少一条文本片段;根据所述至少一个条件层所生成的至少一条文本片段,以及所述顶层对应的疑问文本,采用端到端的句子生成模型生成所述提问信息。4.根据权利要求1

3任一项所述的方法,其中,所述根据所述至少一个条件层中的所述属性键、属性值和所述关联关系,生成对应条件层的至少一组词语组合,包括:对所述至少一个条件层中的属性键、属性值和所述关联关系,分别确定所述属性键的同义词语集合、所述属性值的同义词语集合,以及所述关联关系的同义词语集合;从所述属性键的同义词语集合、所述属性值的同义词语集合,以及所述关联关系的同义词语集合中,分别选取词语进行组合,以得到至少一组词语组合。5.根据权利要求4所述的方法,其中,所述对所述至少一个条件层中的属性键、属性值和所述关联关系,分别确定所述属性键的同义词语集合、所述属性值的同义词语集合,以及所述关联关系的同义词语集合,包括:对所述属性键、属性值和所述关联关系中的至少一个,查询同义词词库,以确定对应的同义词语集合。6.根据权利要求4所述的方法,其中,所述对所述至少一个条件层中的属性键、属性值和所述关联关系,分别确定所述属性键的同义词语集合、所述属性值的同义词语集合,以及所述关联关系的同义词语集合,包括:
将任一所述条件层所含的所述属性键、属性值和所述关联关系中的至少一个作为元素,根据所述元素中字符的词性和/或语义,匹配语义成分模板;根据匹配的语义成分模板,查询关联的至少一文本模板;依据所述元素中所含字符的词性和/或语义,将所述字符填充到所述至少一文本模板中,以得到所述元素的同义词语;将所述元素,以及基于所述至少一文本模板所生成的同义词语,作为所述同义词语集合。7.根据权利要求4所述的方法,其中,所述对所述至少一个条件层中的属性键、属性值和所述关联关系,分别确定所述属性键的同义词语集合、所述属性值的同义词语集合,以及所述关联关系的同义词语集合,包括:将任一所述条件层所含的所述属性键、属性值和所述关联关系中的至少一个作为元素,输入端到端的文本生成模型中,以得到输出的同义词语;将所述元素,以及所述端到端的文本生成模型输出的同义词语,作为所述同义词语集合。8.根据权利要求1

3任一项所述的方法,其中,所述根据设定的树形结构模板,对所述至少一组键值对进行组合,以得到树形结构,包括:分别确定各所述键值对在所述树形结构模板中对应的层;针对各所述键值对对应层中的任一条件层,根据对应键值对中属性值的数据类型,确定所述条件层对应的所述关联关系;针对各所述键值对对应层中的所述顶层,根据对应键值对中属性键,确定疑问对象,以及根据所述树形结构模板中所述顶层设定的疑问词,确定所述疑问文本;根据所述顶层对应的所述疑问文本,各所述条件层对应的键值对和对应的所述关联关系,确定所述树形结构。9.根据权利要求8所述的方法,其中,所述针对各所述键值对对应层中的任一条件层,根据对应键值对中属性值的数据类型,确定所述条件层对应的所述关联关系,包括:针对任一条件层,在对应键值对的属性值为字符串的数据类型的情况下,确定所述条件层对应的所述关联关系为等于;在对应键值对的属性值为非字符串的数据类型的情况下,确定所述条件层对应的所述关联关系为等于和不等于中的...

【专利技术属性】
技术研发人员:田孟冯欣伟姜文斌陈帅宇吴学谦柴春光李斐斐时鸿剑孙雨王煜杨霖
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1