当前位置: 首页 > 专利查询>燕山大学专利>正文

基于邻域关系表征向量的知识图谱嵌入表示方法及系统技术方案

技术编号:35568286 阅读:19 留言:0更新日期:2022-11-12 15:52
本发明专利技术涉及一种基于邻域关系表征向量的知识图谱嵌入表示方法及系统,包括实体的邻域关系表征向量的生成、同类型实体集的划分以及同类型实体特征的提取与融合,本发明专利技术的目的基于实体的邻域关系类型及其数量,采用邻域关系表征向量的形式对实体的邻域关系特性进行数值性刻画,奠定了使用聚类方法对实体邻域关系向量相似性度量的基础,在知识图谱嵌入模型的训练过程中完成同类型实体特征的提取以及同类型实体特征与实体嵌入向量的融合。本发明专利技术为提取高质量的同类型实体特征以及增强知识图谱嵌入表示的准确性奠定了基础,给出了一种新的知识图谱嵌入表示方法,本发明专利技术方法还具有计算复杂度低、适用性好、同类型实体划分结果的可解释好等优点。可解释好等优点。可解释好等优点。

【技术实现步骤摘要】
基于邻域关系表征向量的知识图谱嵌入表示方法及系统


[0001]本专利技术涉及知识图谱嵌入表示领域,具体地涉及一种基于邻域关系表征向量的知识图谱嵌入表示方法及系统。

技术介绍

[0002]在知识图谱相关研究中,知识图谱嵌入(KGE,又称知识表示学习KRL),是一项将知识图谱中的关系和实体的语义信息表示为稠密低维实值向量,且在低维空间中高效计算实体和关系的语义联系的一种表示学习技术,是贯穿知识图谱的构建与应用全过程的关键基础技术之一。
[0003]对知识图谱中实体和关系嵌入表示的准确程度或质量的高低,直接影响着诸多知识获取、知识图谱应用的模型性能,如链接预测、三元组分类、实体分类、实体对齐,以及基于知识图谱的智能问答、信息检索、系统推荐、多源信息融合等。因此,知识图谱嵌入表示准确性的提升,对基于知识图谱的知识获取与应用的模型性能具有重要的基础性意义。
[0004]在以知识图谱补全或链接预测任务为驱动的知识图谱嵌入技术的相关研究工作中,如何更好的建模三元组信息、如何更多地融合三元组事实以外的其他信息,以更好地提升知识图谱嵌入表示的准确本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于邻域关系表征向量的知识图谱嵌入表示方法,其特征在于,其包括以下子步骤:S1、生成实体的邻域关系表征向量,得到实体的邻域关系表征向量集合Ω;S2、生成同类型实体集,具体包括如下子步骤:S21、定义维度为2*m的向量max和min;S22、对max和min向量进行赋值;S23、对集合Ω中的任意实体邻域关系表征向量v
i
进行归一化处理,得到归一化处理后的邻域关系表征向量集合Ω';S24、采用聚类方法将邻域关系表征向量集合Ω'中的实体邻域关系表征向量聚为K个簇,则按同簇的邻域关系表征向量从实体集合E中挑选相对应的实体e
i
,从而完成同类型实体集C
k
(k∈[1,K])的划分;S3、进行同类型实体特征的提取与融合,具体包括如下子步骤:S31、根据步骤S2生成的同类型实体集,确定实体e
i
所属的同类型实体集C
k
;S32、根据同类型实体集C
k
从基准知识图谱嵌入模型的实体嵌入矩阵中挑取相应的实体嵌入向量,并将各个实体嵌入向量按式(2)拼接为同类型实体嵌入矩阵E
k
;其中,||表示拼接操作,h
i
为同类型实体集C
k
中实体e
i
的嵌入向量;S33、在基准知识图谱嵌入模型的训练过程中,采用式(3)所示的线性降维方式实现从同类型实体嵌入矩阵E
k
中提取蕴含的实体类型特征t
k
;t
k
=σ(W
k
E
k
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中,σ(
·
)为mish激活函数,W
k
为线性变换矩阵,模型训练结束后,最终得到的t
k
即为同类型实体集C
k
中所有实体的类型特征;S34、将实体类型特征t
k
与实体e
i
的嵌入向量h
i
进行串联拼接后,按式(4)所示将拼接后的特征向量输入至全连接层,从而得到融合实体类型特征t
k
后的实体嵌入向量e'
i
;e

i
=concat(h
i
,t
k
)W+b
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,concat为将两个特征向量串行拼接的操作,h
i
为通过知识图谱嵌入模型得到的实体e
i
的嵌入向量,t
k
为实体e
i
所属类别的实体类型的特征向量表示,W∈R
(dim1+dim2)
×
dim1
为权重矩阵,dim1为实体e
i
嵌入向量h
i
的维度,dim2为实体类型特征向量t
k
的维度,e'
i
为实体e
i
的嵌入向量h
i
融合实体类型特征向量t
k
后的嵌入向量表示,b为偏置参数;S35、按式(5)更新实体嵌入矩阵中实体e
i
的嵌入向量h
i
;h
i
=e

i
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)S36、在以基准知识图谱嵌入模型的评分函数和损失函数为约束的训练过程中,通过反向传播实现模型...

【专利技术属性】
技术研发人员:李志明郭唯健李婷婷
申请(专利权)人:燕山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1