一种基于团检测的知识表示学习方法和系统技术方案

技术编号:34996960 阅读:15 留言:0更新日期:2022-09-21 14:45
本申请涉及一种基于团检测的知识表示学习方法,其中,该方法包括:确定目标知识节点及其关联知识节点,基于目标知识节点和关联知识节点,构建知识图;依据预设规则对知识图进行处理,得到目标知识节点对应的团检测信息;基于团检测信息,对关联知识节点,添加不同的负样本标记;算法模型在知识表示学习的过程中,根据负样本标记,对关联知识节点施加不同的惩罚权重系数,并生成知识表示向量。通过本申请,解决了知识表示学习中,同类型的不同实体向量区分度较低的问题,提升了知识表示向量的区分度。度。度。

【技术实现步骤摘要】
一种基于团检测的知识表示学习方法和系统


[0001]本申请涉及知识图谱领域,特别是涉及一种基于团检测的知识表示方法、和系统。

技术介绍

[0002]知识图谱将世界上所有人物、地名、书名等名词与实务表示为实体,将实体之间的内在联系表示为关系,其作用在于,将数据库中的海量知识表示为实体之间利用关系作为桥梁的三元关系组。
[0003]知识表示学习应用在知识图谱上,可以将实体与关系映射到向量空间中,从而解决知识图谱因数据量巨大导致的稀疏性问题。但是,当前知识表示学习方法通常基于翻译模型,该类方法对于同类型下的不同实体,具有过于相近的表示向量,实体之间的向量区分度不高。
[0004]目前针对相关技术中,知识表示学习中,同类型的不同实体向量区分度较低的问题,尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种基于团检测的知识表示学习方法、系统、计算机设备和计算机可读存储介质,以至少解决相关技术中相似实体向量区分度较低的问题。
[0006]第一方面,本申请实施例提供了一种基于团检测的知识表示学习方法,所述方法包括:
[0007]确定目标知识节点及其关联知识节点,基于所述目标知识节点和关联知识节点,构建知识图;
[0008]依据预设规则对所述知识图进行处理,得到所述目标知识节点对应的团检测信息;
[0009]基于所述团检测信息,对所述关联知识节点,添加不同的负样本标记;
[0010]算法模型在知识表示学习的过程中,根据所述负样本标记,对所述关联知识节点施加不同的惩罚权重系数,并生成知识表示向量。
[0011]在其中一些实施例中,所述团检测信息包括:非团节点、所述目标知识节点的共团节点和非共团节点。
[0012]在其中一些实施例中,依据预设规则对所述知识图进行处理,得到所述目标知识节点对应的团检测信息,包括:
[0013]生成所述知识图对应的关系矩阵,获取所述关系矩阵中的行和;
[0014]根据所述行和,确定所述知识图中的非团节点,将其非团节点从所述知识图中删除,得到待处理知识图,其中,所述非团节点的行和为1;
[0015]在所述待处理知识图中,通过预设流程,获取所述目标知识节点的共团节点和非共团节点;
[0016]基于所述非团节点的信息、所述共团节点的信息和所述非共团节点的信息,生成
所述目标知识节点对应的团检测信息。
[0017]在其中一些实施例中,所述预设流程包括如下:
[0018]S1,生成所述待处理知识图对应的关系矩阵,根据所述关系矩阵,判断所述待处理知识图中是否包括单团节点,若是,顺序执行S2,若否,跳转执行S4;
[0019]S2,获取所述单团节点,基于所述单团节点及其直连节点组成第一clique;
[0020]S3,判断所述第一clique是否等同于所述待处理知识图,若是,跳转执行S5,
[0021]若否,将所述第一clique中的所有单团节点从所述待处理知识图中删除,并循环执行S1至S3,得到至少一个第二clique,以及,不包括单团节点的待处理知识图,并顺序执行S4;
[0022]S4,在所述待处理知识图中,获取行和最小的对象知识节点,并基于所述对象知识节点及其连接关系,构建第一子图和第二子图,
[0023]其中,所述第一子图包括对象知识节点的共团节点,所述第二子图包括,除所述对象知识节点的共团节点之外的其他知识节点;
[0024]S5,判断是否从S4跳转至S5,若是,将所述第一子图作为S1中的待处理知识图,并循环执行S1

S5,得到至少一个第三clique,并将所述第二子图保存在内存空间,作为备用知识图数据,
[0025]若否,从内存空间读取所述备用知识图数据,并将其作为S1中的待处理知识图,并循环执行S1

S5,得到至少一个第四clique;
[0026]若当前内存空间中不存在所述备用知识图数据,则循环终止;
[0027]S6,根据S1

S5中累计得到的:第一clique、第二clique、第三clique、第四clique,得到所述取所述目标知识节点的共团节点和非共团节点。
[0028]在其中一些实施例中,通过所述关系矩阵,判断所述待处理知识图中是否包括单团节点,包括:
[0029]在所述关系矩阵中,获取各个知识节点对应的行和,判断所述行和是否满足预设等式关系,若是,则输出所述知识节点是单团节点的响应信号,其中,所述预设等式关系如下:
[0030]r
p
=n
p
*(n
p

1)
[0031]其中,r
p
是知识节点的行和,n
p
是与知识节点共团的其余节点的数量。
[0032]在其中一些实施例中,所述方法还包括:
[0033]对所述目标知识节点的共团节点,添加第一负样本标记,并在知识表示学习的过程中,对其施加第一惩罚权重参数;
[0034]对所述目标知识节点的非共团节点,添加第二负样本标记,并在知识表示学习过程中,对其施加第二惩罚权重参数
[0035]对所述非团节点,添加第三负样本标记,并在知识表示学习过程中,对其施加第三惩罚权重参数,
[0036]其中,所述第三惩罚权重参数大于所述第二惩罚权重参数,所述第二惩罚权重参数大于所述第一惩罚权重参数。
[0037]在其中一些实施例中,算法模型在知识表示学习结束之后,在生成的知识表示向量中:
[0038]所述目标知识节点的周围,属于同一个团的知识表示向量内聚,不属于同一个团的知识表示向量离散。
[0039]第二方面,本申请实施例提供了一种基于团检测的知识表示学习系统,所述系统包括:构建模块、团检测信息获取模块、标记添加模块和知识表示学习模块,其中;
[0040]所述构建模块,用于确定目标知识节点及其关联知识节点,基于所述目标知识节点和关联知识节点,构建知识图;
[0041]所述团检测信息获取模块,用于依据预设规则对所述知识图进行处理,得到所述目标知识节点对应的团检测信息;
[0042]所述标记添加模块,用于基于所述团检测信息,对与所述关联知识节点,添加不同的负样本标记;
[0043]所述知识表示学习模块,用于在算法模型进行知识表示学习的过程中,根据所述负样本标记,对所述关联知识节点施加不同的惩罚权重系数,并生成知识表示向量。
[0044]第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的方法。
[0045]第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的方法。
[0046本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于团检测的知识表示学习方法,其特征在于,所述方法包括:确定目标知识节点及其关联知识节点,基于所述目标知识节点和关联知识节点,构建知识图;依据预设规则对所述知识图进行处理,得到所述目标知识节点对应的团检测信息;基于所述团检测信息,对所述关联知识节点,添加不同的负样本标记;算法模型在知识表示学习的过程中,根据所述负样本标记,对所述关联知识节点施加不同的惩罚权重系数,并生成知识表示向量。2.根据权利要求1所述的方法,其特征在于,所述团检测信息包括:非团节点、所述目标知识节点的共团节点和非共团节点。3.根据权利要求2所述的方法,其特征在于,依据预设规则对所述知识图进行处理,得到所述目标知识节点对应的团检测信息,包括:生成所述知识图对应的关系矩阵,获取所述关系矩阵中的行和;根据所述行和,确定所述知识图中的非团节点,将其非团节点从所述知识图中删除,得到待处理知识图,其中,所述非团节点的行和为1;在所述待处理知识图中,通过预设流程,获取所述目标知识节点的共团节点和非共团节点;基于所述非团节点的信息、所述共团节点的信息和所述非共团节点的信息,生成所述目标知识节点对应的团检测信息。4.根据权利要求3所述的方法,其特征在于,所述预设流程包括如下:S1,生成所述待处理知识图对应的关系矩阵,根据所述关系矩阵,判断所述待处理知识图中是否包括单团节点,若是,顺序执行S2,若否,跳转执行S4;S2,获取所述单团节点,基于所述单团节点及其直连节点组成第一clique;S3,判断所述第一clique是否等同于所述待处理知识图,若是,跳转执行S5,若否,将所述第一clique中的所有单团节点从所述待处理知识图中删除,并循环执行S1至S3,得到至少一个第二clique,以及,不包括单团节点的待处理知识图,并顺序执行S4;S4,在所述待处理知识图中,获取行和最小的对象知识节点,并基于所述对象知识节点及其连接关系,构建第一子图和第二子图,其中,所述第一子图包括对象知识节点的共团节点,所述第二子图包括,除所述对象知识节点的共团节点之外的其他知识节点;S5,判断是否从S4跳转至S5,若是,将所述第一子图作为S1中的待处理知识图,并循环执行S1

S5,得到至少一个第三clique,并将所述第二子图保存在内存空间,作为备用知识图数据,若否,从内存空间读取所述备用知识图数据,并将其作为S1中的待处理知识图,并循环执行S1

S5,得到至少一个第四clique;若当前内存空间中不存在所述备用知识图数据,则循环终止;S6,根据S1
...

【专利技术属性】
技术研发人员:李鑫甄化春戴超铭
申请(专利权)人:医惠科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1