【技术实现步骤摘要】
一种基于Mf_SimplE的知识图谱表示学习方法
[0001]本专利技术涉及互联网
,尤其涉及一种基于Mf_SimplE的知识图谱表示学习方法
技术介绍
[0002]随着互联网技术的高速发展,数据的来源渠道越来越广,每年数据量都在呈指数级别增长。各种各样的信息通过不同的途径被呈现在人们面前,使得数据的获取也越来越方便,人们的需求从快速获取信息转换为快速定位高质量有效信息,真正通过数据来驱动某一领域发展的关键点也并非是该领域内数据信息的体量而是通过数据挖掘问题本质和规律。基于此背景,知识图谱便由于其强大的信息处理效率和知识组织能力,逐渐进入研究人员视野中,受到人们更为广泛的关注。知识表示学习将知识图谱中的实体和关系映射到连续稠密的低维向量空间,将不同来源的实体和关系映射到同一语义空间中,有效地解决了数据稀疏问题,有助于提高计算效率,同时能够充分利用对象间的语义信息,能有效缓解数据稀疏问题,从而高效地实现语义相似度计算等任务,并显著提升计算效率。
技术实现思路
[0003]本专利技术提出的基于Mf_Simp ...
【技术保护点】
【技术特征摘要】
1.一种基于Mf_SimplE的知识图谱表示学习方法,具体包括如下步骤:S1、对知识图谱中的三元组进行预处理生成负三元组:读取知识图谱数据中的一批三元组S,对于S中任意的三元组(e1,r,e2),如果选择头部节点,则从实体集E中随机选择除e1以外的节点来替换e1组成新的负三元组,以同样的方式也可以通过替换尾结点来得到负三元组;S2、随机初始化实体节点和关系向量:将数据集中的实体节点和关系对应的向量进行随机均匀初始化,定义模型中的超参数,嵌入向量维度大小;S3、设置batchsize的大小,从知识图谱中取出batchsize组三元组,从三元组中随机抽取若干个按照步骤一中的方式生成负三元组合并batchsize组原本正确的三元组构成三元组集A输入到Mf_SimplE模型中,提取出实体和关系对应的向量的一阶近似和二阶近似组成混合特征,根据混合特征计算出相似度分数,更新模型中的权重参数降低损失函数值直至收敛。2.根据权利要求1所述的一种基于Mf_SimplE的知识图谱表示学习方法,其特征在于:所述步骤S1中需要替换头或者尾实体结点生成负三元组,生成负三元组采用了TransE模型中破坏正确的三元组中的头结点或者尾结点的方法。3.根据权利要求1所述的一种基于Mf_SimplE的知识图谱表示学习方法,其特征在于:所述步骤S2中需要提取实体和节点的一阶特征和阶特征,并可需要针对数据集中提供的正三元组(e1,r,e2),需要通过SimplE模型的方法进行关系转换生成三元组(e1,r,e2)对应的逆向三元组(e2,r
‑1,e1),正向和逆向三元组一同进行实体和关系向量的初始化。4.根据权...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。