【技术实现步骤摘要】
一种基于时序知识图谱的综合影响力补偿方法
[0001]本专利技术涉及一种基于时序知识图谱的综合影响力补偿方法,属于时序知识图谱
技术介绍
[0002]知识图谱(Knowledge Graph,KG)是以图数据库的形式将知识进行结构化存储的知识系统,其本质是语义网络。由于知识图谱拥有极强的表达能力,蕴涵逻辑含义和规则,并且建模灵活,因此得到了研究人员的关注并被广泛应用于信息检索、智能问答系统、推荐系统等多个行业的具体应用中。
[0003]将表示学习应用于知识图谱,把要描述的对象表示为低维稠密向量,即采用分布式表示方法可以有效解决数据稀疏问题,并且便于在低维语义空间中进行计算。
[0004]一种基于实体和关系的分布式向量表示模型TransE,以及在此基础上针对多关系改进的TransH、TransR和TransD等知识翻译模型,通过向量翻译和空间映射的方式来刻画静态知识信息,而在现实世界中,知识往往是带有时间标签的,并且会随时间发生变化。因此考虑时间因素的时序知识图谱开始成为引起研究人员的关注,并提出了四 ...
【技术保护点】
【技术特征摘要】
1.一种基于时序知识图谱的综合影响力补偿方法,其特征在于:包括:S1、将数据集进行清洗,抽取清洗后数据集中的三元组知识(h,r,t)及该三元组知识所代表的事件发生的时间,将抽取的多条由三元组知识(h,r,t)及该三元组知识所代表的事件发生的时间T构成的数据分为训练集和测试集,对训练集进行知识图谱的构建;其中,三元组知识中的头实体的h、尾实体t在知识图谱中作为节点,三元组知识中的关系r作为知识图谱中节点间的联系;统计训练集、测试集中所有头实体、尾实体,去重后用实体集合表示为E={E1,E2,E3....E
N
};统计训练集、测试集中所有关系,去重后用关系集合表示为R={R1,R2,R3....R
M
};其中,E
N
表示第N个实体,实体为头实体/尾实体,实体总个数为N;R
M
表示第M个关系,关系总个数为M;S2、在步骤S1中构建好的知识图谱上,对历史时间轴按照固定长度d进行时间片的划分,将时间轴上的元组事件划分为{G1,G2....G
n
},G
n
表示第n个事件子网;对应每一个子网构建出邻接矩阵{A(G1),A(G2)....A(G
n
)},通过邻接矩阵以及相似性指标计算出存在共同邻居节点的节点对之间的相关性,然后融合时间因素,得到融合时间因素的相关性影响力;将得到的影响力作为在当前事件确定的条件下该时间片对当前事件的历史相关性综合影响力;S3、对于划分完成的时间片,根据与当前时间节点的跨度,进行时间跨度区间的划分,并赋予不同的跨度因子计算获得补偿后的历史事件的综合影响力。2.根据权利要求1所述的基于时序知识图谱的综合影响力补偿方法,其特征在于:将补偿后的历史事件的综合影响力作为权重融入到知识表示模型中,迭代获取实体和关系融合时间因素后的向量表示;通过训练得到的向量表示,在测试集上根据得分排名和性能指标进行链路预测任务。3.根据权利要求1或2所述的基于时序知识图谱的综合影响力补偿方法,其特征在于:所述S2具体为:S2.1、在步骤S1中构建好的知识图谱上,对历史时间轴按照固定长度d对知识图谱进行时间片的划分,将时间轴上的事件划分为{G1,G2....G
n
},G
n
表示第n个事件子网;S2.2、对应每个事件子网构建邻接矩阵{A(G1),A(G2)....A(G
n
)},A(G
n
)表示事件子网G
n
的邻接矩阵;S2.3、对应各个邻接矩阵,统计所有节点对的共同邻居节点;S2.4、统计各节点对的每个共同邻居节点的节点度,作为该邻居节点在此间接连接中的重要贡献程度,将节点对间所有的共同邻居节点重要程度通过Adamic
‑
Adar指标计算出节点对之间的相关性S
AB
;S2.5、将时间作为第四元知识信息添加三元组知识表示方式中,事件表示为正四元组(h,r,t,T),对于当前时间点上发生的当前事件(A,r,B,T2),根据当前事件的头实体、尾实体,遍历通过S2.4步骤获得的节点对之间的相关性,将满足当前时间点上头实体为A、尾实体为B的S
AB
与时间衰减函数融合,得到融合时间因素的相关性影响力SIM(A,B),作为该时间片对当前时间点上发生的头实体为A、尾实体为B的当前事件的历史相关性综合影响力。4.根据权利要求3所述的基于时序知识图谱的综合影响力补偿方法,其特征在于:所述时间衰减函数f(T1)=e
‑
λ(T2
‑
T1)
;其中,T1表示知识图谱中代表历史事件的节点A和节点B所处的时间点,T2表示当前事件的头实体为A、尾实体为B时所处的时间点,λ为衰减因子...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。