一种知识图谱的知识补全方法及装置制造方法及图纸

技术编号：21914047 阅读：27 留言：0更新日期：2019-08-21 12:27

本发明专利技术提供一种知识图谱的知识补全方法及装置，能够解决知识补全过程中存在的负例无意义和1‑N关系难以处理的问题。方法包括：确定实体和关系对应的空间向量；根据实体和关系对应的空间向量，计算语义关系，得到实体之间新的关系，补全知识图谱；利用生成式对抗网络随机生成负例，并结合导出的事实三元组训练第一知识表示模型；对得到的事实三元组进行概念分层，随机选择事实三元组同一子概念下的实体构造负例，并结合导出的事实三元组，采用最大间隔方法，训练第二知识表示模型；将第二知识表示模型作为第一知识表示模型的判别器输入，通过对抗生成式网络优化第一知识表示模型，得到用于知识补全的目标知识表示模型。本发明专利技术涉及知识工程领域。

A Knowledge Completion Method and Device for Knowledge Map

全部详细技术资料下载

【技术实现步骤摘要】
一种知识图谱的知识补全方法及装置
本专利技术涉及知识工程领域，特别是指一种知识图谱的知识补全方法及装置。
技术介绍
知识图谱经常以高结构化的形式表示，描述了现实世界中各种实体之间的关系。目前，知识图谱已经广泛应用于各个领域，例如：自动问答、信息抽取等领域。典型的知识图谱是由大量的三元组组成。虽然知识图谱可以提供高质量的结构化数据，但是大多数公开的知识图谱，都是通过人工或者半自动的方法构建的，这些图谱往往会存在数据稀疏的问题甚至大量实体之间的关系没有被充分的挖掘出来，为了得到更加高质量的知识图谱，需将知识图谱进行知识补全。知识补全的目标是补全知识图谱中缺失的事实，其中，每个事实都可表示成一个形式为(头实体,关系,尾实体)的三元组。现有技术中，一般通过表示学习的方法来进行知识补全，但是存在很多问题，例如，以基于翻译的嵌入式(TranslatingEmbedding，TransE)模型为例，对于负例的选取，通常所用的方法是随机替换三元组的头实体或者尾实体构造负例，但是这种方法可能会产生一个无意义的负例；TransE模型力求嵌入的头实体向量加关系向量与尾实体向量足够靠近，可以很好地处理1-1关系，但是在处理1-N关系时，存在多个实体竞争一个向量空间点的现象，其中，N为大于1的整数。
技术实现思路
本专利技术要解决的技术问题是提供一种知识图谱的知识补全方法及装置，以解决现有技术所存在的利用TransE模型进行知识补全过程中存在的负例无意义和1-N关系难以处理的问题。为解决上述技术问题，本专利技术实施例提供一种知识图谱的知识补全方法，包括：获取知识图谱，根据获取的知识图谱...

【技术保护点】
1.一种知识图谱的知识补全方法，其特征在于，包括：获取知识图谱，根据获取的知识图谱，输出实体和关系对应的空间向量；根据得到的实体和关系对应的空间向量，计算语义关系，得到实体之间新的关系，补全知识图谱；利用生成式对抗网络随机生成负例，并结合导出的事实三元组训练第一知识表示模型，其中，所述生成式对抗网络包括：生成器和判别器；对得到的事实三元组进行概念分层，随机选择事实三元组同一子概念下的实体构造负例，并结合导出的事实三元组，采用最大间隔方法，训练第二知识表示模型；将第二知识表示模型作为第一知识表示模型的判别器输入，通过对抗生成式网络优化第一知识表示模型，得到用于知识补全的目标知识表示模型。

【技术特征摘要】
1.一种知识图谱的知识补全方法，其特征在于，包括：获取知识图谱，根据获取的知识图谱，输出实体和关系对应的空间向量；根据得到的实体和关系对应的空间向量，计算语义关系，得到实体之间新的关系，补全知识图谱；利用生成式对抗网络随机生成负例，并结合导出的事实三元组训练第一知识表示模型，其中，所述生成式对抗网络包括：生成器和判别器；对得到的事实三元组进行概念分层，随机选择事实三元组同一子概念下的实体构造负例，并结合导出的事实三元组，采用最大间隔方法，训练第二知识表示模型；将第二知识表示模型作为第一知识表示模型的判别器输入，通过对抗生成式网络优化第一知识表示模型，得到用于知识补全的目标知识表示模型。2.根据权利要求1所述的知识图谱的知识补全方法，其特征在于，所述获取知识图谱包括：获取原始知识图谱；构建属性图对原始知识图谱中利用率小于预设的利用率阈值的实体节点进行知识表示。3.根据权利要求2所述的知识图谱的知识补全方法，其特征在于，所述根据获取的知识图谱，输出实体和关系对应的空间向量包括：根据处理得到的知识图谱，导出事实三元组，并通过随机替换事实三元组的头实体或者尾实体来构造负例；根据导出的事实三元组及构造的负例，应用基于TransE模型的知识嵌入表示，输出实体和关系对应的空间向量，其中，TransE表示翻译的嵌入式。4.根据权利要求3所述的知识图谱的知识补全方法，其特征在于，所述根据处理得到的知识图谱，导出事实三元组包括：根据处理得到的知识图谱，利用图形数据库导出事实三元组。5.根据权利要求1所述的知识图谱的知识补全方法，其特征在于，所述根据得到的实体和关系对应的空间向量，计算语义关系，得到实体之间新的关系，补全知识图谱包括：根据得到的实体和关系对应的空间向量，选取事实三元组的头实体和关系，计算尾实体的能量，获取推理排名为前k的尾实体及其打分分数；根据得到的实体和关系对应的空间向量，选取事实三元组的尾实体和关系，计算头实体的能量，获取推理排名为前k的头实体及其打分分数；根据实体的概念类型，将推理得到的实体与预先确定的候选集进行比较，去掉非候选集中的实体；根据打分分数，确定推理得到的实体的置信度，取置信度排名为前k’的推理实体补充其与头实体或尾实体之间的关系，补全知识图谱。6.根...

【专利技术属性】
技术研发人员：谢永红，李珍珍，张德政，阿孜古丽，栗辉，贾麒，
申请(专利权)人：北京科技大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人