【技术实现步骤摘要】
基于嵌入式学习的知识图谱的实体关系优化方法
[0001]本专利技术属于计算机科学和人工智能
,具体涉及一种基于嵌入式学习的知识图谱的实体关系优化方法。
技术介绍
[0002]知识图谱是将各类结构化和非结构化信息、数据和连接关系聚合为知识的有效组织方法。它以三元组的形式存储知识,并具有强大的语义处理和开放的组织能力,是互联网时代知识型组织和智能应用的基础。关系抽取的目标是解决实体间语义链接的问题。早期的关系抽取主要依赖人工构造语义规则和模板来识别实体关系,但这种方法耗费领域专家大量时间和精力,且可移植性差,无法适应新的文本语料库。
[0003]机器学习算法的发展为解决关系抽取问题提供了新方案。传统的机器学习方法分为有监督、半监督和无监督三类。有监督的关系抽取算法准确性较高,但受标注数据质量和数量的影响,且不能拓展到新关系。半监督和无监督方法对标注数据的依赖性较弱,适合大规模开放领域的关系抽取,但准确率较低且拓展性有限。近年来,基于深度学习的方法开始主导关系抽取领域。这些方法利用神经网络自动从原始文本中提取特征,避免了繁琐的手动特征工程,并且在处理复杂文本关系时具有强大的泛化能力。根据实体与关系抽取的顺序,关系抽取方法可以分为流水线方法和实体关系联合抽取方法,它们通常采用CNN、RNN及其改进模型进行关系抽取。
[0004]数据可视化在快速获取知识和洞察规律方面起到了重要作用。将可视分析技术应用于知识图谱中可以提高知识图谱的构建和表达。常见的知识图谱可视化包括节点连接、矩阵、层次结构等形式。可视分析 ...
【技术保护点】
【技术特征摘要】
1.基于嵌入式学习的知识图谱的实体关系优化方法,其特征在于,该方法步骤包括:步骤(1)设定知识图谱G=(VE,EG,TG);三元组集合TG={(h1,r1,t1),(h2,r2,t2),
…
,(h
K
,r
K
,t
K
)},K表示三元组数量;三元组中,h表示头实体,t表示头尾体,r表示头实体对尾实体的关系;实体集合VE={(h1,t1),(h2,t2),
…
,(h
K
,t
K
)},关系集合EG={r1,r2,
…
,r
K
};构建三元组线图GL=(VL,EL,w);其中,节点集合VL中包括三元组节点和关系节点,三元组节点即为三元组集合TG中的所有三元组,关系节点即为关系集合EG中的所有关系;每个三元组节点与所有关系节点的连线即为边,EL表示边的集合,w表示边的权重,包括两个三元组节点构成的边的权重w
T
和三元组节点与关系节点构成的边的权重w
R
;如果三元组(h
i
,r
i
,t
i
)和(h
j
,r
j
,t
j
)满足即两个三元组具有相同实体,则在GL中添加一条无向边E
i,j
∈EL,即两个三元组节点的连线;步骤(2)设定权重w
T
和w
R
的占比α和β,α>0,β>0,α+β=1,则两个三元组节点构成的边的游走概率三元组节点与关系节点构成的边的游走概率从每个三元组节点开始,按照游走概率进行游走,直到达到指定的游走长度,即游走过的三元组节点的个数,游走生成的三元组节点序列构成语料库,语料库通过word2vec算法中的Skip
‑
gram模型学习三元组节点之间的关系,得到每个三元组节点所对应的向量表示,即每一个词作为中心词生成背景词的联合概率;使用t
‑
SNE降维算法将Skip
‑
gram模型学习到的向量表示投影至二维平面上,得到每个三元组的二维平面分布,所有三元组的二维平面分布构成嵌入空间;步骤(3)在嵌入空间,对于具有相同头实体对尾实体的关系r的三元组,计算该部分三元组的中心坐标,与中心坐标欧式距离大于设定值的三元组即为可信性低三元组,为其推荐更可能正确的关系:计算每个关系r的中心坐标,以及可信性...
【专利技术属性】
技术研发人员:周志光,张永,马煜明,刘玉华,孟瑜炜,俞荣栋,傅骏伟,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。