一种融合图结构和文本信息的自适应知识图谱表示学习方法技术

技术编号：28035589 阅读：24 留言：0更新日期：2021-04-09 23:17

本发明专利技术公开了一种融合图结构和文本信息的自适应知识图谱表示学习方法，包括：(1)采样目标三元组头、尾实体的邻居三元组；(2)计算每个目标三元组和其头、尾实体的邻居三元组的语义表示；(3)计算目标三元组头、尾实体的结构表示；(4)将目标三元组自身的语义表示与其头、尾实体的结构表示拼接，输入自适应分类层，计算分类结果和分类损失；(5)基于梯度下降的优化算法对上述模块进行优化，直至损失值收敛，得到目标三元组自身的语义表示与其头、尾实体的结构表示的最终拼接结果。本发明专利技术能够同时捕捉知识图谱的语义表示和图结构表示，自适应地将语义和结构信息融合并且充分利用，在信息缺乏的知识图谱上表现出更好的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合图结构和文本信息的自适应知识图谱表示学习方法
本专利技术属于知识图谱表示
，具体涉及一种融合图结构和文本信息的自适应知识图谱表示学习方法。
技术介绍
知识图谱(KG)，例如FreeBase，YAGO和WordNet等被逐渐构建起来，它们为许多重要的AI任务，例如语义搜索，推荐和问答等提供了有效的基础。知识图谱通常是一个多关系图，主要包含实体、关系和三元组，每一个三元组以实体作为节点和关系作为边缘，表示一条知识。三元组以(头部实体，关系，尾部实体)(简称为(h，r，t))的形式表示，例如(乔布斯，创建，苹果公司)即表示了“乔布斯创建了苹果公司”这样一条知识。知识图谱中往往包含了大量信息，我们认为其中两种较为重要的信息是结构信息和文本信息。结构信息指实体通过关系与其他实体存在的某种联系，一个实体的结构信息往往可通过其邻居三元组体现；文本信息指知识图谱中实体和关系的文本描述的语义信息，通常由实体和关系的名称、实体和关系的额外文字说明等体现。当前大多数知识图谱还远远不够完整，因此激发了知识图补全的任务，该任务旨...

【技术保护点】
1.一种融合图结构和文本信息的自适应知识图谱表示学习方法，其特征在于，包括以下步骤：/n(1)对每个目标三元组，分别采样其头实体和尾实体的邻居三元组；/n(2)对每个三元组和其头、尾实体的邻居三元组，通过语义表示模块SRM分别计算语义表示；/n(3)将目标三元组头、尾实体的邻居三元组的语义表示输入结构提取模块SEM，计算目标三元组头、尾实体的结构表示；/n(4)将目标三元组自身的语义表示与其头、尾实体的结构表示拼接，拼接后输入自适应分类层，用输出的概率分布与真实标签计算损失；/n(5)基于梯度下降的优化算法对上述模块进行优化，直至损失值收敛，得到目标三元组自身的语义表示与其头、尾实体的结构表示...

【技术特征摘要】
1.一种融合图结构和文本信息的自适应知识图谱表示学习方法，其特征在于，包括以下步骤：
(1)对每个目标三元组，分别采样其头实体和尾实体的邻居三元组；
(2)对每个三元组和其头、尾实体的邻居三元组，通过语义表示模块SRM分别计算语义表示；
(3)将目标三元组头、尾实体的邻居三元组的语义表示输入结构提取模块SEM，计算目标三元组头、尾实体的结构表示；
(4)将目标三元组自身的语义表示与其头、尾实体的结构表示拼接，拼接后输入自适应分类层，用输出的概率分布与真实标签计算损失；
(5)基于梯度下降的优化算法对上述模块进行优化，直至损失值收敛，得到目标三元组自身的语义表示与其头、尾实体的结构表示的最终拼接结果。

2.根据权利要求1所述的融合图结构和文本信息的自适应知识图谱表示学习方法，其特征在于，步骤(1)的具体过程如下：
令G表示一个知识图谱，E表示该知识图谱中的实体集合，R表示该知识图谱中的关系集合；采样目标三元组x＝(h，r，t)头、尾实体的邻居三元组，邻居三元组包括两部分：头实体邻居三元组和尾实体邻居三元组，分别记为
其中，ri，rj∈R，ti，hj∈E，a是可设置的超参数，表示采样的头、尾实体的邻居三元组的数目。

3.根据权利要求1所述的融合图结构和文本信息的自适应知识图谱表示学习方法，其特征在于，步骤(2)中，所述的语义表示模块SRM采用预训练语言模型bert，并删除bert模型最后的分类层；
语义表示模块的输入是由三元组的头实体、关系、尾实体的文本描述按序组成的一个句子序列，实体和关系的文本描述之间用分隔符[SEP]间隔，序列首部增加输出标识[OUT]；
语义表示模块的输出是该模块最后一隐藏层中[OUT]位对应的输出向量，该输出向量为对应输入三元组的语义表示。

4.根据权利要求3所述的融合图结构和文本信息的自适应知识图谱表示学习方法，其特征在于，目标三元组x的语义表示用公...

【专利技术属性】
技术研发人员：陈华钧，朱渝珊，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人