一种基于混合专家模型和联合学习的知识库问题生成方法技术

技术编号：29309674 阅读：42 留言：0更新日期：2021-07-17 02:09

本发明专利技术公开了一种基于混合专家模型和联合学习的知识库问题生成方法，主要用于给定知识图谱三元组子图、答案和复杂关系信息的情况下生成与给定三元组子图相关的，可被答案回答的，并且对应给定关系信息的、多样化的复杂自然语言表述问题。本发明专利技术使用图神经网络对输入三元组子图进行编码，得到输入子图的向量表示。使用Transformer网络进行解码，生成问题。在解码过程中结合复杂问题场景，使用隐变量建模有效表示关系的结构信息。此外使用混合专家模型，指导问题生成，提升生成问题的多样性。最后使用知识图谱问答任务与知识图谱问题生成任务联合训练，用于约束问题生成过程，使生成的问题包含期望的复杂关系信息，实现生成复杂问题的目的。问题的目的。问题的目的。

A knowledge base problem generation method based on hybrid expert model and joint learning

全部详细技术资料下载

【技术实现步骤摘要】
一种基于混合专家模型和联合学习的知识库问题生成方法

[0001]本专利技术属于自然语言处理领域，涉及一种基于混合专家模型和联合学习的知识库问题生成方法。

技术介绍

[0002]近年来，随着人工智能的快速发展，自然语言处理技术得到了越来越广泛的关注。而问题生成(Question Generation，QG)作为自然语言理解的子任务，是自然语言处理更深层次的研究，对于人工智能技术发展有着重要推动作用。问题生成作为问答(Question Answering，QA)任务的对偶任务，可以为QA任务生成高质量的训练数据集，实现FAQ(Frequently Asked Questions，常见问题解答)文档自动生成、自动辅导系统(automatic tutoring systems)实现。
[0003]问题生成任务根据给定的事实源输入(如文本、图片、知识库)和答案，生成自然语言表述的问题。知识图谱问题生成(Question Generation over Knowledge Base，KBQG)与一般 QG任务主要区别在于输入从知识库来的事实一般以三元组<主语，关系谓词，宾语>形式表示，根据给定答案生成自然语言表述的问题。如对于给定三元组<中国，首都，北京>，可以生成问题“中国的首都是哪个城市？”。知识图谱问题生成处理的结构化三元组信息，在搜索系统中广泛使用，对比基于文本的问题生成任务有着更大的应用价值。
[0004]传统的问题生成方法通过使用规则、模板和人工...

【技术保护点】

【技术特征摘要】
1.一种基于混合专家模型和联合学习的知识库问题生成方法，其特征在于，该方法分为三个模块，包括如下步骤：a.知识图谱复杂问题生成模块1)通过对输入三元组子图进行重构，实现从输入中编码得到复杂问题生成所需的复杂关系信息；2)使用图神经网络GraphTransformer方法对重构后的输入三元组子图进行编码；3)使用混合专家模型，预测专家选择不同的生成结果，提升生成问题的多样性；4)使用隐变量建模关系的结构信息，实现对复杂关系的编码，指导复杂问题的生成；5)使用Transformer网络，在关系结构编码信息和选择专家的指导下对编码结果进行解码，生成问题；b.知识图谱复杂问题问答(KBQA)模块6)使用Transformer对输入复杂问题进行编码；7)使用混合专家模型选择不同的专家，指导完成问答的过程；8)预测关系的层级依存关系，完成对复杂问题的复杂关系编码解析；9)使用Transformer网络预测复杂问题对应的关系序列，完成问答过程；c.联合学习模块10)通过联合学习，知识图谱问答实现对知识图谱问题生成的约束，提升生成问题包含的复杂关系准确性，生成高质量的复杂问题。2.根据权利要求书1所述的基于混合专家模型和联合学习的知识库问题生成方法，其特征在于，所述步骤1)的具体方法是：对于输入三元组构成一个子图其中V是实体节点集合，E是关系边集合，而该子图为带边权值图，对该带边权值图的子图进行重构，将带属性的关系边扩展成节点，然后通过无权置边链接实体节点和新扩展的关系节点，将该带边权值图子图重构为无权值边子图；更具体的，对于每一个关系边，扩展成两个节点，分别表示该关系的正向关系和逆向关系，然后通过正向有向边联通三元组的头实体节点、正向关系节点和尾实体节点，通过逆向有向边联通三元组的尾实体节点、逆向关系节点和头实体节点，同时额外增加一个全局节点，并与所有关系节点连接。3.根据权利要求书1所述的基于混合专家模型和联合学习的知识库问题生成方法，其特征在于，所述步骤3)的具体方法是：自定义有K个专家，问题生成的目标为最大化下式：其中z
q
∈{1,
…
,K}表示模型选择的专家，G是输入子图，θ
q
是知识图谱复杂问题生成模块模型参数，Q是目标生成的问题，p(.)表示括号内部分的概率。4.根据权利要求书1所述的基于混合专家模型和联合学习的知识库问题生成方法，其特征在于，所述步骤4)中，在解码器生成问题时使用隐变量来表示时间步t生成词语是否属于一个新的短句，隐变量计算式...

【专利技术属性】
技术研发人员：陈佳敏，毕胜，漆桂林，
申请(专利权)人：东南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人