面向不完备知识图谱的关系链接方法技术

技术编号：27514107 阅读：18 留言：0更新日期：2021-03-02 18:46

本发明专利技术公开了一种面向不完备知识图谱的关系链接方法，包括以下步骤：对输入的自然语言问句进行关键词提取、命名实体和类型识别与消歧，得到实体与类型链接列表；进行依存分析，获得问句对应的语义依存树，然后进行语义化搜索，判断树中任意实体类型对之间是否存在直接依存关系，得到过滤的实体类型对集合；在知识图谱中枚举所有以过滤出的实体和类型为头节点，且长度小于阈值的关系路径，得到候选关系路径列表；分别利用预训练的语言模型和知识图谱表示学习模型，将问句和候选关系路径转化为向量表示，进行相似度比较，选取相似度最高的候选关系路径作为最终的关系链接结果。本发明专利技术实现了对自然语言问句关系的鲁棒准确链接。实现了对自然语言问句关系的鲁棒准确链接。实现了对自然语言问句关系的鲁棒准确链接。

全部详细技术资料下载

【技术实现步骤摘要】
面向不完备知识图谱的关系链接方法

[0001]本专利技术涉及知识图谱和自然语言处理
，尤其涉及一种面向不完备知识图谱的关系链接方法，具体是一种基于表示学习的面向不完备知识图谱的关系链接方法，特别是一种通过将自然语言问句和候选关系路径转化为向量进行相似度计算来实现面向关系路径的关系链接方法。

技术介绍

[0002]随着互联网的发展，网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点，给人们有效获取信息和知识提出了挑战。知识图谱(Knowledge Graph)以其强大的语义处理能力和开放组织能力，为互联网时代的知识化组织和智能应用奠定了基础。知识图谱旨在描述真实世界中存在的各种实体或概念及其相互关系。其中，每个实体或概念用一个全局唯一确定的统一资源标识符来标识。每个属性-值对用来刻画实体的内在特性，而关系用来链接两个实体，刻画它们之间的关联。知识图谱也可以被看作是一张巨大的图，图中的节点表示实体或概念，而图中的边则由属性或关系构成。现在比较流行的知识图谱有DBpedia、Wikidata、Freebase、YAGO等，然而这些知识图谱仍然是不完备的。
[0003]自然语言处理(natural language processing)是研究人类用自然语言与计算机之间进行通信的技术，属于语言学、计算机科学、认知科学等相关学科的交叉学科，涉及范围广泛。此领域研究人与计算机交互的语言问题，探讨如何处理及运用自然语言，特别是如何编程计算机以成功处理大量的自然语言数据。处理自然语言...

【技术保护点】

【技术特征摘要】
1.一种面向不完备知识图谱的关系链接方法，其特征在于，包括以下步骤：(1.1)对于输入的一个自然语言问句，提取所述自然语言问句中的关键词，进行命名实体识别与消歧、类型识别与消歧，生成实体与类型链接列表；(1.2)基于所述步骤(1.1)得到的实体与类型链接列表，进行依存分析，获得所述自然语言问句所对应的语义依存树，然后根据规则将所述语义依存树转化为有向图，并在所述有向图中进行语义化搜索，得到过滤实体类型对集合；(1.3)基于所述步骤(1.2)得到的实体类型对集合，在知识图谱中枚举所有以过滤出的实体和类型为头节点，且长度小于阈值的关系路径，得到候选关系路径列表；(1.4)基于所述步骤(1.3)得到的候选关系路径列表，分别利用预训练的语言模型和知识图谱表示学习模型，将所述自然语言问句和候选关系路径转化为向量表示，并进行相似度比较，选取相似度最高的候选关系路径作为最终的关系链接结果。2.根据权利要求1所述的面向不完备知识图谱的关系链接方法，其特征在于，所述步骤(1.2)包括以下步骤：(2.1)基于所述步骤(1.1)得到的实体与类型链接列表，进行依存分析，得到所述自然语言问句对应的语...

【专利技术属性】
技术研发人员：胡伟，赵耀，丁基伟，
申请(专利权)人：南京大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人