The invention discloses a construction method and system of a data service platform based on knowledge atlas, which includes the following steps: cleaning multi-source heterogeneous data; querying the cleaned data, generating resource ID through redis; building OWL ontology and managing plug-ins, and storing the data using a determinant database. The invention has the advantages of object-oriented and flexible storage of data, full mining of knowledge information contained in unstructured and semi-structured data, and contributing to providing high-quality structured data for various later application fields.
【技术实现步骤摘要】
基于知识图谱的数据服务平台的构建方法及系统
本专利技术涉及工业物联网
,具体来说,涉及一种基于知识图谱的数据服务平台的构建方法及系统。
技术介绍
知识图谱旨在描述真实世界中存在的各种实体或概念,以及他们之间的关联关系,它的每一个实体用全局唯一确定的ID来标识,就如每个人都有一个身份证号码;第二个就是用属性-值对来刻画实体的内在特性,用关系来连接两个实体,刻画他们之间的关联。信息技术尤其是互联网的飞速发展,推动着大数据时代的来临,各行各业每天都在产生数量巨大的数据碎片,数据计量单位已从Byte、KB、MB、GB、TB发展到PB、EB、ZB、YB甚至BB、NB、DB来衡量,对大数据数据的采集已经不再是技术问题,但其蕴藏的知识大量存在于非结构化的文本数据和大量半结构化的表格和网页以及生产系统的结构化数据中;传统的数据信息存储采用关系型数据库,其设计复杂、冗余度大且查询效率低,无法直接获取数据中需要推理、挖掘的隐性语义信息。针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
针对相关技术中的上述技术问题,本专利技术提出一种基于知识图谱的数据服务平台的构建方法及系统,能够面向对象地和灵活地存储数据,充分挖掘数据中蕴藏的知识信息,有助于为后期各种应用领域提供高质量的结构化数据。为实现上述技术目的,本专利技术的技术方案是这样实现的:一种基于知识图谱的数据服务平台的构建方法,包括以下步骤:将多源异构数据进行清洗;针对清洗后的数据进行查询,将查询后的数据通过redis生成资源ID;构建OWL本体并对插件进行管理,将所述数据利用列式数据库进行存储。进一步地,所 ...
【技术保护点】
1.一种基于知识图谱的数据服务平台的构建方法,其特征在于,包括以下步骤:将多源异构数据进行清洗;针对清洗后的数据进行查询,将查询后的数据通过redis生成资源ID;构建OWL本体并对插件进行管理,将所述数据利用列式数据库进行存储。
【技术特征摘要】
1.一种基于知识图谱的数据服务平台的构建方法,其特征在于,包括以下步骤:将多源异构数据进行清洗;针对清洗后的数据进行查询,将查询后的数据通过redis生成资源ID;构建OWL本体并对插件进行管理,将所述数据利用列式数据库进行存储。2.根据权利要求1所述的基于知识图谱的数据服务平台的构建方法,其特征在于,所述将多源异构数据进行清洗包括:针对不同数据源加载ETL插件获取ETL规则,构建实体后获取实体间的关系;调用资源服务子系统获取资源ID;将资源化后的数据生成结构化的数据对象。3.根据权利要求1所述的基于知识图谱的数据服务平台的构建方法,其特征在于,所述将多源异构数据进行清洗之前还包括,利用数据采集客户端采集多源异构数据。4.根据权利要求3所述的基于知识图谱的数据服务平台的构建方法,其特征在于,所述数据采集客户端包括数据获取程序组件、关联ID生成组件、关联ID发送组件和非主动服务响应组件。5.根据权利要求1-4任一项所述的基于知识图谱的数据服务平台的构建方法,其特征在于,所述针对清洗后的数据进行查询包括利用全文搜索引擎访问全局ID;在图数据库中,根据所述全局ID检索相互关联的实体,返回所有关联ID;在分布式数据存储系统中,根据所述关联ID检索结构化数据,返回相应属性结果。6.一种基于知识图谱的数据服务平台的构建系统,其特征在于,包括:数据清洗模块,用于将...
【专利技术属性】
技术研发人员:徐汕,梁炬,黄文锋,张晶亮,刘强,单酉,杨端,卫未,
申请(专利权)人:北京航天云路有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。