System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种分布式知识图谱的构建系统及其方法技术方案_技高网

一种分布式知识图谱的构建系统及其方法技术方案

技术编号:40009420 阅读:11 留言:0更新日期:2024-01-16 15:02
本发明专利技术提出一种分布式知识图谱的构建方法,包括:进行实时知识抽取;将抽取的非结构化内容进行结构化加工,构建知识图谱。本发明专利技术还提供分布式知识图谱的构建系统。本发明专利技术提供的分布式知识图谱的构建方法及系统,可以有效减少集中抽取时的资源投入,将不同客户端的知识图谱进行搜集,进行结构化加工和处理,并进行全局构建,有效提升了知识的完整性和实时性,能够廉价、快速地构建企业内部的知识图谱,提升企业的知识管理水平。

【技术实现步骤摘要】

本专利技术涉及数据处理,特别涉及一种分布式知识图谱的构建系统及其方法


技术介绍

1、在当今时代,知识已成为企业的核心竞争力,如何更好的沉淀、存储和抽取知识已成为企业打造核心竞争力亟待解决的问题。在企业的日常运营中,以本地文件、在线文档等方式积累了很有用的知识,但缺少有效的方法进行抽取。比如,采用集中或分布式的文件备份或存储系统,可以较好的解决沉淀和存储问题,但无法对知识进行萃取,发现知识间的关联,进而可以产生新的有用的知识。知识图谱指用于增强搜索引擎功能的知识库,旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。知识图谱的引入,通过对知识进行压缩并构建知识间的管理,可以有效发现文档间的联系,激活企业沉淀的文档。比如,通过知识关联,员工可以在检索时,不仅可以精确查找到具体用户的信息和文档,而且也可以通过知识图谱发现行业、竞争对手,甚至具体项目以及关联信息等,实现企业内知识的再利用。

2、知识图谱作为一种有效的知识抽取和关联技术,在企业推广使用时,面临巨大的问题和挑战,尤其是针对中小企业。首先,传统的知识图谱需要采用集中的方式进行加工和处理,如何将分散在员工电脑上的文档集中到服务器上进行知识图谱的搜集,是一个巨大的挑战;再次,由于采用集中处理的方式,服务器、网络和存储资源必不可少,投入较大,而知识的使用是一个长期、渐进的过程,上述投入却不能有立竿见影的效果。


技术实现思路

1、本专利技术的目的在于提供一种分布式知识图谱的构建系统及其方法,以解决如何针对知识更新建立相应的知识图谱的问题。

2、为了解决上述技术问题,本专利技术的技术方案是:提供一种分布式知识图谱的构建方法,包括:进行实时知识抽取;将抽取的非结构化内容进行结构化加工,构建知识图谱。

3、进一步地,在分布式知识图谱的构建方法中,实时知识抽取包括:当用户对文档进行编辑并关闭或保存时,知识抽取客户端自动扫描内存中的内容,进行实时知识抽取。

4、进一步地,在分布式知识图谱的构建方法中,所述实时知识抽取的内容包括文档名称、创建时间、文档类型、文档关键字、知识实体内容。

5、进一步地,在分布式知识图谱的构建方法中,如果所述文档为更新版本,系统自动标记出两个版本知识的差异,并对原知识版本进行加1处理。

6、进一步地,在分布式知识图谱的构建方法中,将抽取的非结构化内容进行结构化加工包括:服务器将关键词输入原知识图谱,判定所述关键词对应的知识是否可以构建入原知识图谱,若所述关键词对应的知识内容有效,则对所述知识进行结构化加工,进行原知识图谱更新。

7、本专利技术还提供一种分布式知识图谱的构建系统,包括:知识抽取客户端,进行实时知识抽取;服务器端,将抽取的非结构化内容进行结构化加工,构建知识图谱。

8、进一步地,在分布式知识图谱的构建系统中,所述实时知识抽取的内容包括文档名称、创建时间、文档类型、文档关键字、知识实体内容。

9、进一步地,在分布式知识图谱的构建系统中,如果所述文档为更新版本,系统自动标记出两个版本知识的差异,并对原知识版本进行加1处理。

10、进一步地,在分布式知识图谱的构建系统中,将抽取的非结构化内容进行结构化加工包括:服务器将关键词输入原知识图谱,判定所述关键词对应的知识是否可以构建入原知识图谱,若所述关键词对应的知识内容有效,则对所述知识进行结构化加工,进行原知识图谱更新。

11、本专利技术还提供一种终端设备,所述终端设备包括至少一个处理器,以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述的分布式知识图谱的构建方法。

12、本专利技术提供的分布式知识图谱的构建方法及系统,可以有效减少集中抽取时的资源投入,将不同客户端的知识图谱进行搜集,进行结构化加工和处理,并进行全局构建,有效提升了知识的完整性和实时性,能够廉价、快速地构建企业内部的知识图谱,提升企业的知识管理水平。

13、进一步地,考虑到文档存放和类型的差异,系统只抽取文档中的主要内容,如词频、关键词、关键实体等,信息量较少,降低了企业存放和类型差异的难度。由于采用在本地电脑进行内存抽取,不同文档格式的差异不同产品的兼容性问题也可以有效地解决。

本文档来自技高网...

【技术保护点】

1.一种分布式知识图谱的构建方法,其特征在于,包括:

2.如权利要求1所述的分布式知识图谱的构建方法,其特征在于,实时知识抽取包括:当用户对文档进行编辑并关闭或保存时,知识抽取客户端自动扫描内存中的内容,进行实时知识抽取。

3.如权利要求2所述的分布式知识图谱的构建方法,其特征在于,所述实时知识抽取的内容包括文档名称、创建时间、文档类型、文档关键字、知识实体内容。

4.如权利要求2所述的分布式知识图谱的构建方法,其特征在于,如果所述文档为更新版本,系统自动标记出两个版本知识的差异,并对原知识版本进行加1处理。

5.如权利要求2所述的分布式知识图谱的构建方法,其特征在于,将抽取的非结构化内容进行结构化加工包括:服务器将关键词输入原知识图谱,判定所述关键词对应的知识是否可以构建入原知识图谱,若所述关键词对应的知识内容有效,则对所述知识进行结构化加工,进行原知识图谱更新。

6.一种分布式知识图谱的构建系统,其特征在于,包括:

7.如权利要求6所述的分布式知识图谱的构建系统,其特征在于,所述实时知识抽取的内容包括文档名称、创建时间、文档类型、文档关键字、知识实体内容。

8.如权利要求7所述的分布式知识图谱的构建系统,其特征在于,如果所述文档为更新版本,系统自动标记出两个版本知识的差异,并对原知识版本进行加1处理。

9.如权利要求6所述的分布式知识图谱的构建系统,其特征在于,将抽取的非结构化内容进行结构化加工包括:服务器将关键词输入原知识图谱,判定所述关键词对应的知识是否可以构建入原知识图谱,若所述关键词对应的知识内容有效,则对所述知识进行结构化加工,进行原知识图谱更新。

10.一种终端设备,其特征在于,所述终端设备包括至少一个处理器,以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行权利要求1-5中任一项所述的分布式知识图谱的构建方法。

...

【技术特征摘要】

1.一种分布式知识图谱的构建方法,其特征在于,包括:

2.如权利要求1所述的分布式知识图谱的构建方法,其特征在于,实时知识抽取包括:当用户对文档进行编辑并关闭或保存时,知识抽取客户端自动扫描内存中的内容,进行实时知识抽取。

3.如权利要求2所述的分布式知识图谱的构建方法,其特征在于,所述实时知识抽取的内容包括文档名称、创建时间、文档类型、文档关键字、知识实体内容。

4.如权利要求2所述的分布式知识图谱的构建方法,其特征在于,如果所述文档为更新版本,系统自动标记出两个版本知识的差异,并对原知识版本进行加1处理。

5.如权利要求2所述的分布式知识图谱的构建方法,其特征在于,将抽取的非结构化内容进行结构化加工包括:服务器将关键词输入原知识图谱,判定所述关键词对应的知识是否可以构建入原知识图谱,若所述关键词对应的知识内容有效,则对所述知识进行结构化加工,进行原知识图谱更新。

6.一种分布式知识图谱的构建系统,其特征在于...

【专利技术属性】
技术研发人员:刘旭峰伍智濂俞俊峰
申请(专利权)人:上海云思智慧信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1