一种基于知识图谱的知识增广方法技术

技术编号:38528601 阅读:7 留言:0更新日期:2023-08-19 17:03
本发明专利技术公开了一种基于知识图谱的知识增广方法,该方法包括知识增广部分和测试部分。知识增广部分使用聚类方法,对原有的数据进行层次聚类,同时设置不同的聚类阈值以获取不同阈值下的新的聚类向量,将同一增广层下的聚类向量与原有数据求取欧式距离。进一步把新增的属性数据和原有的数据转化为知识图谱三元组的形式。通过集合操作将两部分数据融合到一起,构成新的增广数据集。对于测试部分,任选一种推理模型,使用添加增广知识的数据和未添加增广知识的数据对比,通过比较同一种推理方法不同的推理效果,体现出知识增广的效果。本发明专利技术提供的知识增广方法在推理效果上具有明显的提升效果。的提升效果。的提升效果。

【技术实现步骤摘要】
一种基于知识图谱的知识增广方法


[0001]本专利技术属于人工智能
,具体涉及一种基于知识图谱的知识增广方法。

技术介绍

[0002]在当前人工智能的知识图谱领域,有许多研究的方向,例如知识图谱补全,实体对齐,知识表示等等。知识图谱补全一般是对知识图谱三元组的预测,一般的形式是根据实体节点和关系预测下一个实体节点。实体对齐则是考虑将异源的知识图谱实体通过某种算法嵌入到相同的维度里,以增加知识图谱的信息量。而知识表示则是研究如何将知识转化到一种更加方便简单的表示形式。这些研究方向最主要的目的是通过知识图谱实现知识推理,这些研究方向从各种角度来改变知识图谱,进一步使得推理更加简单。但是这些方法并没有从数据自身的角度去思考如何进一步改进。

技术实现思路

[0003]为了克服现有技术的不足,本专利技术提供了一种基于知识图谱的知识增广方法,该方法包括知识增广部分和测试部分。知识增广部分使用聚类方法,对原有的数据进行层次聚类,同时设置不同的聚类阈值以获取不同阈值下的新的聚类向量,每一个阈值下的聚类向量属于同一增广层,不同增广层下的数据粒度不同,将同一增广层下的聚类向量与原有数据求取欧式距离。每一个聚类向量为一个新的属性,而欧式距离为新的属性值。进一步把新增的属性数据和原有的数据转化为知识图谱三元组的形式。通过集合操作将两部分数据融合到一起,构成新的增广数据集。对于测试部分,任选一种推理模型,使用添加增广知识的数据和未添加增广知识的数据对比,通过比较同一种推理方法不同的推理效果,体现出知识增广的效果。本专利技术提供的知识增广方法在推理效果上具有明显的提升效果。
[0004]本专利技术解决其技术问题所采用的技术方案包括如下步骤:
[0005]步骤1:知识增广部分;
[0006]步骤1

1:使用聚类算法,通过设置不同的阈值,取不同阈值下的新的聚类向量,每一个阈值下的聚类向量属于同一增广层,将获取的新的聚类向量与原有的数据求取欧式距离;
[0007]T
i
=[v
(1)
,v
(2)
,v
(3)
,......v
(j)
],j∈S
i
[0008][0009]其中,T
i
代表每一条聚类向量,F
i
代表求得的欧式距离,M代表原有的数据;
[0010]步骤1

2:每一个聚类向量为新增广的属性,而每一个新的聚类向量与原有数据的欧式距离为新的属性值,同一阈值下的增广向量属于同一个增广层;
[0011]步骤1

3:把所有增广层中新增的属性数据和原有的数据转化为知识图谱三元组的形式;
[0012]步骤1

4:将每一个增广层通过集合操作将新的聚类向量与原有数据融合到一起,
构成新的增广数据集;
[0013]S=S
o
∪S
p
[0014]其中,S
o
为原有数据,S
p
为新的聚类向量。
[0015]步骤1

5:选取不同增广层数据进行推理或多个增广层数据合并推理;
[0016]步骤2:测试部分;
[0017]任选一种推理模型,使用添加增广知识的数据和未添加增广知识的数据作对比,通过比较同一种推理方法在不同数据源下的推理效果,来检测本专利技术基于知识图谱的知识增广方法的效果。
[0018]优选地,所述步骤1

1中原有的数据必须满足层次聚类算法的使用前提。
[0019]本专利技术的有益效果如下:
[0020]本专利技术的增广方法能够很好的提升模型的推理效果,尤其是在少样本的情况下,本专利技术对推理效果的提升显著。
附图说明
[0021]图1为本专利技术方法结构示意图。
具体实施方式
[0022]下面结合附图和实施例对本专利技术进一步说明。
[0023]本专利技术提出了一种新的方法,从知识本身的角度使用算法来增广知识本身,从而使得推理更加容易。
[0024]一种基于知识图谱的知识增广方法,包括如下步骤:
[0025]步骤1:知识增广部分;
[0026]步骤1

1:使用聚类算法,通过设置不同的阈值,取不同阈值下的新的聚类向量,每一个阈值下的聚类向量属于同一增广层,将获取的新的聚类向量与原有的数据求取欧式距离;
[0027]T
i
=[v
(1)
,v
(2)
,v
(3)
,......v
(j)
],j∈S
i
[0028][0029]其中,T
i
代表每一条聚类向量,F
i
代表求得的欧式距离,M代表原有的数据;
[0030]步骤1

2:每一个聚类向量为新增广的属性,而每一个新的聚类向量与原有数据的欧式距离为新的属性值,同一阈值下的增广向量属于同一个增广层;
[0031]步骤1

3:把所有增广层中新增的属性数据和原有的数据转化为知识图谱三元组的形式;
[0032]步骤1

4:将每一个增广层通过集合操作将新的聚类向量与原有数据融合到一起,构成新的增广数据集;
[0033]S=S
o
∪S
p
[0034]其中,S
o
为原有数据,S
p
为新的聚类向量。
[0035]步骤1

5:选取不同增广层数据进行推理或多个增广层数据合并推理;
[0036]步骤2:测试部分;
[0037]任选一种推理模型,使用添加增广知识的数据和未添加增广知识的数据作对比,通过比较同一种推理方法在不同数据源下的推理效果,来检测本专利技术基于知识图谱的知识增广方法的效果。
[0038]具体实施例:
[0039]请参考图1,图1是本专利技术实施例提供的一种基于知识图谱的知识增广方法的结构示意图。
[0040]整个增广方法分为知识增广部分和测试部分。知识增广部分使用层次聚类算法,在原有的数据的基础上,通过设定不同阈值,聚类出不同增广层下具有联合特征的向量,同一聚类阈值下的聚类向量属于同一增广层,并将聚类向量与原始数据样本求取欧氏距离。每一个聚类向量都是一个新的增广特征,而欧式距离则是增广特征对应的特征值。不同的增广层代表着不同数据粒度下的数据增广特征。将增广的数据与原始数据通过集合操作融合到同一个数据集里,最后将增广的数据集转化成知识图谱的形式。进一步可以根据具体应用,选取不同增广层数据进行推理。对于测试部分,任选一种推理模型,使用添加增广知识的数据和未添加增广知识的数据作对比,通过比较同一种推理方法在不同数据源下的推理效果,来检测本专利技术提出的方法的性能。本专利技术的方法能够有效提高模本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的知识增广方法,其特征在于,包括以下步骤:步骤1:知识增广部分;步骤1

1:使用聚类算法,通过设置不同的阈值,取不同阈值下的新的聚类向量,每一个阈值下的聚类向量属于同一增广层,将获取的新的聚类向量与原有的数据求取欧式距离;T
i
=[v
(1)
,v
(2)
,v
(3)
,......v
(j)
],j∈S
i
其中,T
i
代表每一条聚类向量,F
i
代表求得的欧式距离,M代表原有的数据;步骤1

2:每一个聚类向量为新增广的属性,而每一个新的聚类向量与原有数据的欧式距离为新的属性值,同一阈值下的增广向量属于同一个增广层;步骤1
...

【专利技术属性】
技术研发人员:黄庆华王永臻
申请(专利权)人:西北工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1