基于关系预测的知识图谱智能问答方法技术

技术编号:25948543 阅读:17 留言:0更新日期:2020-10-17 03:40
本发明专利技术涉及一种基于关系预测的知识图谱智能问答方法,属于自然语言处理领域。该方法包括步骤:S1:输入问题Q,对问题进行预处理;S2:利用实体识别技术识别问题中的实体e

【技术实现步骤摘要】
基于关系预测的知识图谱智能问答方法
本专利技术属于自然语言处理领域,涉及基于关系预测的知识图谱智能问答方法。
技术介绍
传统搜索引擎的基于关键词的搜索方式,缺乏对自然语言的语义分析和语义理解,已经越来越难以满足人们的需求。对使用者而言,符合人类自然语言表达的交互方式才是最佳的,当问答系统表现出足够的智能时,就可以满足使用者对这种交互方式的需求。Google在2012年提出知识图谱(KnowledgeGraphs,KGs)的概念,进一步将问答系统向智能化的方向推动。随着知识图谱技术的发展,智能问答系统展现出了新的发展前景。社交类网站的兴起为智能问答系统的研究提供了大量不同领域的真实问答语料,给机器从数据层面理解自然语言问句提供了极大的方便。而如Freebase、DBpedia等大规模知识图谱的蓬勃发展,则为智能问答系统提供了高质量结构化知识来源。基于知识图谱的智能问答领域,是现阶段问答领域研究中的重要方向。其在人工智能时代具有远大的应用前景,也为移动互联网和人类社会信息入口提供了技术和理论上的支持。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于关系预测的知识图谱智能问答方法,通过构建一种基于注意力的图嵌入方法来推断KGs中隐藏的关系,从而补全KGs中缺失的关系,提高基于知识图谱的问答系统(QuestionAnsweringoverKnowledgeGraphs,KGs-QA)的准确性。为达到上述目的,本专利技术提供如下技术方案:基于关系预测的知识图谱智能问答方法,该方法包括以下步骤:S1:输入问题Q,对问题进行预处理;S2:利用实体识别技术识别问题中的实体equestion,并将实体equestion映射到KGs中对应的实体eKGs;S3:查询KGs中实体eKGs的类别c,用类别c替换问题Q中的实体equestion,标记为Qc;S4:从Qc中映射出关系r;S5:在KGs中,如果实体eKGs和关系r之间缺少联系;S6:学习中心实体eKGs的新的向量表示;S7:基于已有的相关三元组推断KGs中隐藏的关系;S8:基于实体和关系的知识图推理,获得答案A。可选的,所述步骤S1具体为:通过HanLP与Stanfordparser中的CRF句法分析器与最大熵依存句法分析器将文本划分为词或短语,并获取词性、词序、关键词和依存关系量化描述。可选的,所述步骤S2具体为:利用双向长短期记忆网络Bi-LSTM模型对问句中每个单词是否为实体进行预测;采用前向和后向两个LSTM单元对输入序列进行处理,最后输出向量为两个LSTM输出向量的拼接;模型的输出向量为y=(y1,y2,...,yn),其中n为输入序列的长度,该模型输出向量长度与输入序列是保持一致的,yi对应输入问句中第i个单词的标注信息,如果为“1”则代表为寻找的实体,反之则不是。可选的,所述步骤S3具体为:利用潜在狄利克雷主题模型来概念化问句中的实体,以便于对实体的理解,增加其可解释性;通过结合主题模型潜在狄利克雷分配和一个大规模概率KGs,捕获单词之间的语义关系,开发一个基于语料库的上下文相关概念化框架。可选的,所述步骤S4具体为:在关系链接任务中引入卷积神经网络CNNs模型;通过深度神经网络模型,提取问句中关于关系的语义信息,同时对候选实体的所有关系用同样的模型进行处理,将得到的问句属性向量和知识图谱属性向量进行相似度匹配,得到最终链接的正确关系。可选的,所述步骤S5具体为:基于步骤S2识别出来的实体和S4链接出来的关系,将基于实体和关系的知识图推理简化为子图匹配问题;在知识图谱中,若没有找到匹配,即实体eKGs和关系r之间缺少联系,则进行下一步的关系预测任务。可选的,所述步骤S6具体为:为解决不能获取隐藏在三元组周围的领域中信息的问题,优化向量学习模型,提出基于注意力的特征嵌入方法,该方法捕获任意给定实体的邻域内的实体特征和关系特征;在模型中封装关系集群和多跳关系;为得到一个中心实体的新的向量表示,通过线性变换来学习中心实体邻域内存在的每个相关事实集的特征向量。可选的,所述步骤S7具体为:通过识别现有的相关事实三元组(h,r,t)推断最初隐藏的关系,其中,h代表头语义实体,r代表语义关系,t代表尾语义实体;即学习中心实体邻域内的多跳实体和多跳关系,在n-hop领域之间引入一条辅助边,实现关系预测任务。可选的,所述步骤S8具体为:KGs-QA通过学习2782个意图的2700万个模板,以支持二元事实问答。本专利技术的有益效果在于:本专利技术采用知识图的方法对自然语言问句中的实体和关系进行推理,从而找到“问句实体--知识图实体”的对应关系,以及“问句自然语言描述——知识图语义关系”的对应关系,基于模板的知识图推理,得到相应的答案,使我们的自然语言理解功能不仅具备理解字面意思的能力,还具备逻辑推理,理解深层意思的能力。本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。附图说明为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术作优选的详细描述,其中:图1为本专利技术基于知识图谱的智能问答系统构建的流程图;图2为本专利技术本专利技术基于Bi-LSTM的实体识别模型示意图;图3为本专利技术基于CNNs的关系链接模型示意图;图4为本专利技术基于知识图谱的实体识别和关系链接示意图;图5为本专利技术知识图的子图示意图;图6为本专利技术基于实体和关系的知识图推理示意图。具体实施方式以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。其中,附图仅用于示例性说明,表示的仅是示意图,而非实物图,不能理解为对本专利技术的限制;为了更好地说明本专利技术的实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。本专利技术实施例的附图中相同或相似的标号对应相同或相似的部件;在本专利技术的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,本文档来自技高网...

【技术保护点】
1.基于关系预测的知识图谱智能问答方法,其特征在于:该方法包括以下步骤:/nS1:输入问题Q,对问题进行预处理;/nS2:利用实体识别技术识别问题中的实体e

【技术特征摘要】
1.基于关系预测的知识图谱智能问答方法,其特征在于:该方法包括以下步骤:
S1:输入问题Q,对问题进行预处理;
S2:利用实体识别技术识别问题中的实体equestion,并将实体equestion映射到KGs中对应的实体eKGs;
S3:查询KGs中实体eKGs的类别c,用类别c替换问题Q中的实体equestion,标记为Qc;
S4:从Qc中映射出关系r;
S5:在KGs中,如果实体eKGs和关系r之间缺少联系;
S6:学习中心实体eKGs的新的向量表示;
S7:基于已有的相关三元组推断KGs中隐藏的关系;
S8:基于实体和关系的知识图推理,获得答案A。


2.根据权利要求1所述的基于关系预测的知识图谱智能问答方法,其特征在于:所述步骤S1具体为:通过HanLP与Stanfordparser中的CRF句法分析器与最大熵依存句法分析器将文本划分为词或短语,并获取词性、词序、关键词和依存关系量化描述。


3.根据权利要求1所述的基于关系预测的知识图谱智能问答方法,其特征在于:所述步骤S2具体为:利用双向长短期记忆网络Bi-LSTM模型对问句中每个单词是否为实体进行预测;
采用前向和后向两个LSTM单元对输入序列进行处理,最后输出向量为两个LSTM输出向量的拼接;
模型的输出向量为y=(y1,y2,...,yn),其中n为输入序列的长度,该模型输出向量长度与输入序列是保持一致的,yi对应输入问句中第i个单词的标注信息,如果为“1”则代表为寻找的实体,反之则不是。


4.根据权利要求1所述的基于关系预测的知识图谱智能问答方法,其特征在于:所述步骤S3具体为:利用潜在狄利克雷主题模型来概念化问句中的实体,以便于对实体的理解,增加其可解释性;
通过结合主题模型潜在狄利克雷分配和一个大规模概率KGs,捕...

【专利技术属性】
技术研发人员:赵芬李银国侯杰李俊王新恒
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1