【技术实现步骤摘要】
知识图谱构建方法及装置、计算机设备及介质
本专利技术涉及知识图谱
更具体地,涉及一种知识图谱构建方法及装置、计算机设备及介质。
技术介绍
知识图谱(KnowledgeGraph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它能为学科研究提供切实的、有价值的参考。Neo4j图数据库是一个高性能的NOSQL图形数据库,它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。目前,Neo4j图数据库在进行知识图谱构建时,在获取清洗后的数据后需要进行数据字典的 ...
【技术保护点】
1.一种知识图谱构建方法,其特征在于,包括:/n根据实体是否带有属性将实体分为主要实体和次要实体,并进行数据表模式标定,得到主要实体、次要实体及主要实体与次要实体之间的关系;/n判断各次要实体在Neo4j图数据库中是否存在,若否,则导入次要实体;/n依次判断各主要实体在Neo4j图数据库中是否存在及存在的主要实体的属性属否存在,根据判断结果生成对应的Cypher语句;/n执行所述Cypher语句,以导入主要实体、其属性及其与次要实体之间的关系,实现知识图谱构建。/n
【技术特征摘要】
1.一种知识图谱构建方法,其特征在于,包括:
根据实体是否带有属性将实体分为主要实体和次要实体,并进行数据表模式标定,得到主要实体、次要实体及主要实体与次要实体之间的关系;
判断各次要实体在Neo4j图数据库中是否存在,若否,则导入次要实体;
依次判断各主要实体在Neo4j图数据库中是否存在及存在的主要实体的属性属否存在,根据判断结果生成对应的Cypher语句;
执行所述Cypher语句,以导入主要实体、其属性及其与次要实体之间的关系,实现知识图谱构建。
2.根据权利要求1所述的方法,其特征在于,所述依次判断各主要实体在Neo4j图数据库中是否存在及存在的主要实体的属性属否存在,根据判断结果生成对应的Cypher语句包括:
判断各主要实体在Neo4j图数据库中是否存在:
若主要实体不存在,则生成创建主要实体、其属性及其与次要实体之间的关系的Cypher语句;
若主要实体存在,则判断主要实体的属性属否存在:
若主要实体的属性不存在,则生成更新其属性及其与次要实体之间的关系的Cypher语句;
若主要实体的属性存在,则生成更新其与次要实体之间的关系的Cypher语句。
3.根据权利要求2所述的方法,其特征在于,所述若主要实体不存在,则生成创建主要实体、其属性及其与次要实体之间的关系的Cypher语句包括:
若主要实体不存在,则为该主要实体赋予全局唯一标识,并生成创建主要实体、其属性及其与次要实体之间的关系的Cypher语句。
4.根据权利要求1所述的方法,其特征在于,所述生成对应的Cypher语句包括:将预设结构的Cypher语句中的数据值进行相应替换,得到对应的Cypher语句。
5.根据权利要求4所述的方法,其特征在于,所述执行所述Cypher语句包括:利用Python中的Py2neo外部库执行所述Cypher语句。
<...
【专利技术属性】
技术研发人员:杨卓士,
申请(专利权)人:京东方科技集团股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。