基于公共数据资源目录的知识图谱构建系统及构建方法技术方案

技术编号:22884066 阅读:29 留言:0更新日期:2019-12-21 07:20
本发明专利技术公开了一种知识图谱构建系统,包括实体识别单元,用于在多个数据源中识别出对应的第一实体;关系识别单元,用于识别各第一实体间的实体关系;映射关系构建单元,用于构建本体中的第二实体与各第一实体间的映射关系;歧义消除单元,用于消除同一个数据源中的相同的各第一实体的实体歧义;冗余消除单元,用于消除冗余实体;关系推理单元,用于在消除冗余实体后,对各第一实体间的实体关系进行补齐和纠正;第一可视化单元,用于将各第一实体和各第一实体间的实体关系代入到一第一知识表达结构中,然后对第一知识表达结构进行可视化处理,得到一知识图谱,本发明专利技术通过RDF模型构建知识图谱,可适应大数据量、高复杂度的数据关系管理。

Knowledge map construction system and method based on public data resource catalog

【技术实现步骤摘要】
基于公共数据资源目录的知识图谱构建系统及构建方法
本专利技术涉及知识图谱
,尤其涉及一种基于公共数据资源目录的知识图谱构建系统及构建方法。
技术介绍
知识图谱(KnowledgeGraph)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。知识图谱本质上是语义网络(SemanticNetwork)的知识库,作为一种在大数据背景下产生的新型表示知识的方式,将为数据提供新的管理模式,近些年知识图谱已成为知识服务领域的新热点。目前,我国政务数据通常被存储在关系型数据库中。但关系型数据库采用E-R(实体-联系)模型,该模型通过建立数据库表关系记录数据之间的关联关系,然而该模型无法适应大数据量、高复杂度的数据关系管理,执行效能不高,关系数据库维护成本较高。同时在关系数据库中,数据查询可能会导致大量的表连接,从而影响数据查询的响应速度,影响用户使用体验。>专利技术内本文档来自技高网...

【技术保护点】
1.一种知识图谱构建系统,用于基于多个数据源构建知识图谱,其特征在于,包括:/n实体识别单元,用于在多个所述数据源中识别出对应的第一实体;/n关系识别单元,连接所述实体识别单元,用于识别各所述第一实体间的实体关系;/n映射关系构建单元,分别连接所述实体识别单元和所述关系识别单元,用于基于一本体化的第一知识表达结构中,构建本体中的第二实体与各所述第一实体间的映射关系;/n歧义消除单元,连接所述实体识别单元,用于对同一个所述数据源中的相同的各所述第一实体进行实体融合,以消除实体歧义;/n冗余消除单元,连接所述歧义消除单元,用于对消除歧义后的各所述第一实体进行实体解析,以消除冗余实体;/n关系推理单...

【技术特征摘要】
1.一种知识图谱构建系统,用于基于多个数据源构建知识图谱,其特征在于,包括:
实体识别单元,用于在多个所述数据源中识别出对应的第一实体;
关系识别单元,连接所述实体识别单元,用于识别各所述第一实体间的实体关系;
映射关系构建单元,分别连接所述实体识别单元和所述关系识别单元,用于基于一本体化的第一知识表达结构中,构建本体中的第二实体与各所述第一实体间的映射关系;
歧义消除单元,连接所述实体识别单元,用于对同一个所述数据源中的相同的各所述第一实体进行实体融合,以消除实体歧义;
冗余消除单元,连接所述歧义消除单元,用于对消除歧义后的各所述第一实体进行实体解析,以消除冗余实体;
关系推理单元,连接所述冗余消除单元,用于在消除冗余实体后,对各所述第一实体相互间的所述实体关系进行补齐和纠正;
第一可视化单元,分别连接所述冗余消除单元和所述关系推理单元,用于基于所述映射关系,将各所述第一实体和各所述第一实体相互间的实体关系代入到所述第一知识表达结构中,然后对所述第一知识表达结构进行可视化处理,得到所述知识图谱。


2.如权利要求1所述的知识图谱构建系统,其特征在于,还包括:
语义提取单元,用于提取关系数据库中的各数据相对应的语义信息;
模式映射单元,用于将所述关系数据库关系模式转换为RDF(资源描述框架)模式;
数据映射单元,分别连接所述语义提取单元和所述模式映射单元,用于基于各所述数据对应的所述语义信息和所述关系数据库对应的所述RDF模式,将所述关系数据库中的各所述数据映射为相对应的RDF数据;
第二可视化单元,连接所述数据映射单元,用于基于各所述RDF数据和所述RDF模式形成一第二知识表达结构,并将各所述RDF数据以及各所述RDF数据间的实体关系代入到所述第二知识表达结构中,然后将所述第二知识表达结构进行可视化处理,得到所述知识图谱。


3.如权利要求1所述的知识图谱构建系统,其特征在于,所述数据源包括公共数据资源目录、应用场景描述中的文本信息以及现有的关系数据库中的一种或多种。


4.如权利要求1所述的知识图谱构建系统,其特征在于,所述知识图谱构建系统识别各所述数据源中的各所述第一实体的方法包括实体链接技术和命名实体识别技术。


5.如权利要求1所述的知识图谱构建系统,其特征在于,所述知识图谱...

【专利技术属性】
技术研发人员:陈磊刘迎风储昭武管红潘佳徐洁
申请(专利权)人:上海市大数据中心
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1