一种基于层次类别信息的知识图谱构建方法技术

技术编号:26791068 阅读:45 留言:0更新日期:2020-12-22 17:06
本发明专利技术针对现有知识图谱构建方法的不足,公开了一种基于层次类别的知识图谱构建方法,该方法可以利用Word2vec工具,经历以下步骤:实体关系标注、获取关系类别信息、构建层次化类别、知识图谱层次嵌入,自动在知识图谱的关系中加入层次信息,能够极大的提高知识图谱建模的准确性,使得其能够更好的应用于知识问答,智能搜索,案例匹配等实际应用中。

【技术实现步骤摘要】
一种基于层次类别信息的知识图谱构建方法
本专利技术属于知识图谱
,具体涉及一种基于层次类别信息的知识图谱构建方法。
技术介绍
知识图谱本质上是一种大规模语义网络,它包含了各种各样的实体,概念以及语义关系。通过将知识表示成知识图谱的形式,可以让知识更好的被机器去学习和表达。知识图谱的嵌入表示指的是在模型中将知识图谱中的实体和关系表示成一个低维度的向量,进一步提升知识图谱中知识的可计算性。经过知识表示学习中的知识谱图嵌入方法训练后,实体和关系的嵌入结果可以方便的应用于下游任务或者实际应用。比如:知识补全,搜索应用,智能问答,个性化推荐等。又如在法律方面的应用,用户询问一个法律问题,直接就可以通过应用知识图谱构建出回答内容,并可以查询出相似的问题和相关的案例。能否有效的对知识图谱进行建模则成为了应用知识图谱的关键,传统的方法将实体间的关系都看做是独立的,忽视了知识图谱中隐含的诸多信息,比如关系的所属类别,关系之间的对应关系等,从而只能有限的构造出知识图谱的模型,不能很好的刻画一些细节部分,影响到了应用上的准确性。本文档来自技高网...

【技术保护点】
1.一种基于层次类别信息的知识图谱构建方法,其特征在于该方法包括以下步骤:/n步骤1、实体关系标注/n1.1、根据待处理的知识图谱文本数据,使用相应的标注工具将文本中涉及的实体、实体与实体之间的关系标注出来,得到知识图谱中的实体、关系构成;/n1.2、整理从各类文本中获得的所有实体与关系,对其进行去重和实体对齐处理;获得实体和关系的知识库表示形式RDF,即以三元组(实体1,关系,实体2)的方式保存;/n步骤2、获取关系类别信息/n2.1、基于获得的关系,使用Word2Vec词向量嵌入的方法来训练获得初步的关系的语义向量嵌入;/n2.2、对关系的语义向量嵌入分别进行层次聚类,从而获得关系的层次类...

【技术特征摘要】
1.一种基于层次类别信息的知识图谱构建方法,其特征在于该方法包括以下步骤:
步骤1、实体关系标注
1.1、根据待处理的知识图谱文本数据,使用相应的标注工具将文本中涉及的实体、实体与实体之间的关系标注出来,得到知识图谱中的实体、关系构成;
1.2、整理从各类文本中获得的所有实体与关系,对其进行去重和实体对齐处理;获得实体和关系的知识库表示形式RDF,即以三元组(实体1,关系,实体2)的方式保存;
步骤2、获取关系类别信息
2.1、基于获得的关系,使用Word2Vec词向量嵌入的方法来训练获得初步的关系的语义向量嵌入;
2.2、对关系的语义向量嵌入分别进行层次聚类,从而获得关系的层次类别信息;
步骤3、构建层次化类别
根据层次聚类结果,将关系分为三层表示:
第一层为domain,为关系的所属领域;
第二层为types,为关系的主要类别;
第三层是关系的id,即这个关系独一无二的所属编号和内容;
步骤4、知识图谱层次嵌入
4.1、基于步骤1获得的三元组表示和步骤3获得的关系层次信息,使用Translation为基础的嵌入方法,将关系看做是实体之间的旋转向量,通过使得头实体和关系进行旋转运算后与尾实体的差值作为其距离得分函数;
4.2、通过自对抗负样本采样获得不属于该知识图谱中存在的实体的负样本;自对抗负样本采样指的是加入通过...

【专利技术属性】
技术研发人员:徐晨鸥杨柏林
申请(专利权)人:浙江工商大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1