【技术实现步骤摘要】
数据存储方法及装置、数据读取方法及装置
[0001]本说明书实施例涉及计算机
,特别涉及一种数据存储方法、一种数据读取方法。
技术介绍
[0002]知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
[0003]目前,知识图谱的存储结构设计没有统一的标准,对于数据量不是很大且结构固定的图谱,通常使用传统数据库和关系表进行存储。但是,在数据量大的情况下,一个实体通常会包含众多属性,如果同时计算这些属性并存储到存储介质中,会大大降低数据计算、存储、检索的效率。
技术实现思路
[0004]有鉴于此,本说明书施例提供了一种数据存储方法、一种数据读取方法。本说明书一个或者多个实施例同时涉及一种数据存储装置、一种数据读取装置,一种计算设备,一种计算机可读存储介质,一种计算机程序,以解决现有技术中存在的技术缺陷。
[000 ...
【技术保护点】
【技术特征摘要】
1.一种数据存储方法,应用于知识图谱平台,包括:拆分目标知识图谱数据,确定至少两个待存储目标子图数据;其中,所述目标知识图谱数据包括目标实体节点以及至少一个与所述目标实体节点相关联的边,各个所述待存储目标子图数据包括所述目标实体节点以及至少一个目标属性的边;将所述至少两个待存储目标子图数据按照边的属性存储至至少两个连续数据块,其中,前一数据块中存储的待存储目标子图数据的末尾实体标识与后一数据块中存储的待存储目标子图数据的初始实体标识相同。2.根据权利要求1所述的数据存储方法,所述将所述至少两个待存储目标子图数据按照边的属性存储至至少两个连续数据块之后,还包括:记录每个数据块的索引信息,并基于所述每个数据块中的索引信息,确定索引数组信息,其中,所述索引信息包括所述每个数据块中存储的待存储目标子图数据的初始实体标识、末尾实体标识、与末尾实体标识相关联的边属性条件。3.根据权利要求2所述的数据存储方法,所述基于所述每个数据块中的索引信息,确定索引数组信息,包括:确定每个数据块中待存储目标子图数据的初始实体标识、末尾实体标识;在确定两个连续数据块中相邻的末尾实体标识与初始实体标识相同的情况下,对所述两个连续数据块中的索引信息进行处理,确定索引数组信息,其中,所述索引数组信息中的实体标识基于存储顺序排列。4.根据权利要求1所述的数据存储方法,所述拆分所述目标知识图谱数据,确定至少两个待存储目标子图数据,包括:确定拆分参数,并基于所述拆分参数拆分所述目标知识图谱数据,确定至少两个待存储目标子图数据;相应地,所述拆分目标知识图谱数据之前,还包括:对接收到的待处理数据进行处理,确定所述待处理数据的目标实体数据、以及与所述目标实体数据相关联的关系数据;基于所述目标实体数据以及所述关系数据确定所述待处理数据的数据结构,并基于所述数据结构构建目标知识图谱数据。5.根据权利要求4所述的数据存储方法,所述将所述至少两个待存储目标子图数据按照边的属性存储至至少两个连续数据块,包括:确定所述待存储目标子图数据中边的方向,并基于所述边的方向对所述待存储目标子图数据中的边进行分类,确定至少一个边的类型,其中,所述边的方向包括出边方向和入边方向,所述出边方向为由目标实体节点指向其他实体节点的方向,所述入边方向为由其他实体节点指向目标实体节点的方向;基于所述至少一个边的类型将所述至少两个待存储目标子图数据存储至至少两个连续数据块。6.根据权利要求1所述的数据存储方法,所述数据块还包括缓冲区,相应地,所述将所述至少两个待存储目标子图数据按照边的属性存储至至少两个连续数据块,包括:
在所述待存储目标子图数据中确定无法存储至至少两个连续数据块的剩余数据,将所述剩余数据存储至所述至少两个连续数据块的末尾数据块的缓冲区。7.一种数据读取方法,应用于知识图谱平台,包括:接收针对目标数据的数据读取请求,基于所述数据读取请求在索引数组信息中确定目标存储位置;其中,所述索引数组信息基于每个数...
【专利技术属性】
技术研发人员:张达,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。