一种基于知识信息增益的知识图谱嵌入模型解释方法技术

技术编号：40024054 阅读：6 留言：0更新日期：2024-01-16 17:12

本发明专利技术公开一种基于知识信息增益的知识图谱嵌入模型解释方法，涉及知识图谱嵌入模型领域。该基于知识信息增益的知识图谱嵌入模型解释方法，通过生成可解释的子图来解释知识图谱嵌入模型在链接预测任务上的推理结果，为推理过程中所涉及的知识子图中的每条边分配一个边掩码，从而控制消息传递过程中每个三元组对推理结果的影响程度，通过最大化知识信息增益不断优化边掩码并保留对推理结果影响最大的三元组集，为链接预测提供最有价值的解释子图，为知识图谱推理模型提供高质量的解释，并且通过改变掩码阈值可以控制解释集中包含的三元组数量，从而灵活应用于不同的解释场景，弥补了当前知识图谱嵌入模型缺乏可解释性的缺点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及知识图谱嵌入模型，具体为一种基于知识信息增益的知识图谱嵌入模型解释方法。

技术介绍

1、知识图谱嵌入是一种利用监督学习来学习嵌入以及节点和边的向量表示的模型，它们将“知识”投射到一个连续的低维空间，这些低维空间向量一般只有几百个维度(用来表示知识存储的内存效率)，向量空间中，每个点代表一个概念，每个点在空间中的位置具有语义意义。

2、而现在对于知识图谱嵌入模型在不同的应用场景下具有不同的解释，这使得当前知识图谱嵌入模型存在缺乏可解释性的缺点，为此特提供一种基于知识信息增益的知识图谱嵌入模型解释方法以解决上述问题。

技术实现思路

1、(一)解决的技术问题

2、针对现有技术的不足，本专利技术提供了一种基于知识信息增益的知识图谱嵌入模型解释方法，解决了现在对于知识图谱嵌入模型在不同的应用场景下具有不同的解释，这使得当前知识图谱嵌入模型存在缺乏可解释性的缺点的问题。

3、(二)技术方案

4、为实现以上目的，本专利技术通过以下技术方案予以实现：一种基于知识信息增益的知识图谱嵌入模型解释方法，包括以下步骤；

5、步骤1：确定需要解释的知识图谱嵌入模型对于输入的链接预测任务，其任务为eg,r,从g中抽取包含目标关系r的三元组集s，并统计s中尾实体的种类n；

6、步骤2：对于s中的每一条三元组，其三元组为e,r,t，从原始知识图谱g中抽取实体e的k跳子图gs，对于gs中包含的实体集e和关系集r，用中训练完成的特征向量初始化；

7、步骤3：对于子图gs，采用k层图卷积网络m1更新gs中每个实体的特征向量，消息传递形式为：

8、

9、上式中，mi，j，r代表三元组ei,r,ej对应的边掩码值，φ(ei，r)代表知识图谱嵌入模型的知识传递函数；

10、步骤4：通过分类模型m2将实体e输出的特征向量作分类任务，输出n维分类结果向量，并根据尾实体t计算损失函数￡1：

11、

12、步骤5：重复步骤2至步骤4，直至模型收敛，得到目标关系r训练完成的图卷积网络m1和分类模型m2；

13、步骤6：对于目标查询eg,r,通过与步骤2同样的步骤获得知识子图gs并初始化，将gs中目标实体es的特征向量设置为0，以排除es的特征向量中包含的信息对推理结果的影响，并将gs中所有边的掩码值设置为1；

14、步骤7：通过k层图卷积网络m1更新gs中每个实体的特征向量，图卷积形式为：

15、

16、上式中，mi，j，r代表gs中三元组ei,r,ej对应的掩码值；

17、步骤8：通过与步骤4相同的步骤输出n维分类结果向量，并根据知识图谱嵌入模型φ给出的答案eo计算损失函数

18、

19、上式中，g′代表子图gs与对应的掩码矩阵ms作哈德玛积后得到的结果图，代表解释子图约束；

20、步骤9：重复步骤7至步骤8，直至掩码矩阵ms收敛；

21、步骤10：给定解释阈值σ，抽取掩码矩阵ms中所有掩码值大于σ的三元组作为ke-x对于知识图谱嵌入模型在链接预测任务egr，上的解释。

22、优选的，所述步骤3中，所述知识传递函数如下：

23、对于查询e，r，知识图谱推理模型的得分函数可以分解为两部分：计算查询特征向量φ(e，r)以及通过φ(φ(e，r)，ei)计算实体ei的分数，知识传递函数φ的输出值即为查询的特征向量量。

24、优选的，所述步骤8中，所述解释子图约束如下：

25、

26、

27、

28、其中，是离散约束，旨在将边掩码值约束到0和1两个端点值，从而区分关键三元组和冗余三元组，是数量约束，旨在保留最少数量的关键三元组，α和β是控制两大约束对解释结果影响程度的超参数。

29、优选的，所述步骤10中，评估解释效果的方式如下：

30、

31、

32、其中n代表解释查询总数，1为指示函数，为知识图谱嵌入模型φ在依据子图的情况下对于目标实体e1的得分；

33、评估解释稀疏度的指标如下：

34、

35、其中|msi|代表掩码矩阵msi的掩码值总和，代表子图中含有的边的数量。

36、本专利技术公开了一种基于知识信息增益的知识图谱嵌入模型解释方法，其具备的有益效果如下：

37、1、该基于知识信息增益的知识图谱嵌入模型解释方法，通过生成可解释的子图来解释知识图谱嵌入模型在链接预测任务上的推理结果，ke-x框架的本质在于为推理过程中所涉及的知识子图中的每条边分配一个边掩码，从而控制消息传递过程中每个三元组对推理结果的影响程度，通过最大化知识信息增益不断优化边掩码并保留对推理结果影响最大的三元组集，从而为链接预测提供最有价值的解释子图，实验结果表明，ke-x能够为知识图谱推理模型提供高质量的解释，并且通过改变掩码阈值可以控制解释集中包含的三元组数量，从而灵活应用于不同的解释场景，弥补了当前知识图谱嵌入模型缺乏可解释性的缺点。

本文档来自技高网...

【技术保护点】

1.一种基于知识信息增益的知识图谱嵌入模型解释方法，其特征在于，包括以下步骤；

2.根据权利要求1所述的基于知识信息增益的知识图谱嵌入模型解释方法，其特征在于：所述步骤3中，所述知识传递函数如下：

3.根据权利要求1所述的基于知识信息增益的知识图谱嵌入模型解释方法，其特征在于：所述步骤8中，所述解释子图约束如下：

4.根据权利要求1所述的基于知识信息增益的知识图谱嵌入模型解释方法，其特征在于：所述步骤10中，评估解释效果的方式如下：

【技术特征摘要】

1.一种基于知识信息增益的知识图谱嵌入模型解释方法，其特征在于，包括以下步骤；

2.根据权利要求1所述的基于知识信息增益的知识图谱嵌入模型解释方法，其特征在于：所述步骤3中，所述知识传递函数如下：

3.根据权利要...

【专利技术属性】
技术研发人员：万国佳，任婷，
申请(专利权)人：东湖灵境武汉技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人