一种知识图谱创建方法技术

技术编号:25756404 阅读:41 留言:0更新日期:2020-09-25 21:05
本发明专利技术提供了一种知识图谱创建方法。基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取所述集群的数据图表;根据预设的分布式图处理框架将所述数据图表拆分为子图进行迭代计算,并确定数据集;在所述数据集中配置数据访问函数和接口,构成知识开放和共享的知识图谱。本发明专利技术的有益效果在于:本发明专利技术能够支持结构化和非结构化海量数据存储、集成和访问;支持常见异构数据类型。

【技术实现步骤摘要】
一种知识图谱创建方法
本专利技术涉及知识图谱
,特别涉及一种知识图谱创建方法。
技术介绍
目前,现有技术中,知识图谱广泛应用于可视化知识领域映射中。在知识图谱的创建方法中,多数知识图谱的创建是基于场景的知识图谱创建,例如:医院场景、学校场景、商场场景等场景的知识图谱,这类知识图谱范围较小。而较为广泛和全面领域的知识图谱创建过程中存在数据存储不足,数据多数为同构数据,对于异构数据的知识图谱创建方面和可扩展性反面较差,还不具有自动备份和自动回复方面的功能。
技术实现思路
本专利技术提供一种知识图谱创建方法,用以解决现有技术中知识图谱的不足。一种知识图谱创建方法,其特征在于,包括:基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取所述集群的数据图表;根据预设的分布式图处理框架将所述数据图表拆分为子图进行迭代计算,并确定数据集;在所述数据集中配置数据访问函数和接口,构成知识开放和共享的知识图谱。作为本专利技术的一种实施例,所述集群包括主节点、共享存储系统和数本文档来自技高网...

【技术保护点】
1.一种知识图谱创建方法,其特征在于,包括:/n基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取所述集群的数据图表;/n根据预设的分布式图处理框架将所述数据图表拆分为子图进行迭代计算,并确定数据集;/n在所述数据集中配置数据访问函数和接口,构成知识开放和共享的知识图谱。/n

【技术特征摘要】
1.一种知识图谱创建方法,其特征在于,包括:
基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取所述集群的数据图表;
根据预设的分布式图处理框架将所述数据图表拆分为子图进行迭代计算,并确定数据集;
在所述数据集中配置数据访问函数和接口,构成知识开放和共享的知识图谱。


2.根据权利要求1所述的一种知识图谱创建方法,其特征在于,所述集群包括主节点、共享存储系统和数据节点;其中,
所述主节点包括激活主节点、备用节点和主备切换控制器;其中,
所述主备切换控制器用于控制所述激活主节点和备用节点得到切换;
所述共享存储系统用于存储所述主节点在运行过程中产生的分布式文件系统的元数据;
所述共享存储系统还用于控制所述激活主节点和备用节点的数据同步;
所述数据节点用于向所述激活主节点和备用节点上报数据的位置信息。


3.根据权利要求1所述的一种知识图谱创建方法,其特征在于,所述基于运行于集群上的分布式文件系统,确定数据集成的数据模型,并通过所述数据模型获取储存数据的数据图表,包括:
将所述分布式文件系统上的数据以分块的形式划分多个数据块;其中,
所述分布式文件系统包括命名空间,所述命名空间包括源数据和储存所述数据块的数据块池;
所述数据块为独立的存储单元;
所述集群的主节点和备节点基于所述数据块和预设数据节点的多维有序映射和时间戳索引构成数据动态集成的数据模型;
所述数据模型将储存数据以数据图表的形式进行存储;其中,
所述数据图表有行和列组成,列包括若干列族;
所述列族用于统计磁盘和内存的访问、控制和使用。


4.根据权利要求3所述的一种知识图谱创建方法,其特征在于,所述将所述分布式文件系统上的数据以分块的形式划分多个数据块,包括以下步骤:
步骤1:获取所述预设数据节点的存储量S和预设数据节点个数M,



其中,所述wi表示第i个预设数据节点的储存量;所述i=1,2,3,……i;所述β为预设数据节点的空间常数;
步骤2:根据所述预设数据节点的储存量S确定所述预设数据节点的权重值p:



其中,所述pi表示第i个预设数据节点的权重值;所述yi表示第i个预设数据节点的存储能力;
步骤3:根据所述预设数据节点的权重值p,计算所述数据块的划分阈值Ki:



其中,所述表示分布式文件系统上预设数...

【专利技术属性】
技术研发人员:王军平
申请(专利权)人:北京赛博云睿智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1