图谱数据存储方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:24708175 阅读:45 留言:0更新日期:2020-06-30 23:59
本申请提供一种图谱数据存储方法、装置、电子设备及可读存储介质,该方法包括:将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质;其中,所述目标图谱数据存储结构包括多个行存储结构,一个所述行存储结构对应一个结点,所述行存储结构用于存储对应的结点的数据以及该结点的相邻边的数据;在所述多个行存储结构中分别导入对应的结点数据。该方法可以提高图谱的完整性,并可以提高图谱数据查询效率。

【技术实现步骤摘要】
图谱数据存储方法、装置、电子设备及可读存储介质
本申请涉及大数据技术,尤其涉及一种图谱数据存储方法、装置、电子设备及可读存储介质。
技术介绍
随着大数据时代的来临,图数据结构的应用日益广泛。尽管目前市场上已经有很多图谱数据存储方案,但是目前的图谱数据存储方案通常以结点为中心,在导入边数据之前,需要保证边数据的两个相邻结点必须均已经导入。然而实践发现,在实际应用中,经常会出现边数据所对应的两个结点数据中至少一个无法成功导入的情况,从而导致边数据也无法成功导入。
技术实现思路
有鉴于此,本申请提供一种图谱数据存储方法及其装置。具体地,本申请是通过如下技术方案实现的:根据本申请实施例的第一方面,提供一种图谱数据存储方法,包括:将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质;其中,所述目标图谱数据存储结构包括多个行存储结构,一个所述行存储结构对应一个结点,所述行存储结构用于存储对应的结点的数据以及该结点的相邻边的数据;在所述多个行存储结构中分别导入对应的结点数据。根据本申请实施例的第二方面,提供一图谱数据存储装置,包括:第一存储单元,用于将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质;其中,所述目标图谱数据存储结构包括多个行存储结构,一个所述行存储结构对应一个结点,所述行存储结构用于存储对应的结点的数据以及该结点的相邻边的数据;第二存储单元,用于在所述多个行存储结构中分别导入对应的结点数据。根据本申请实施例的第三方面,提供一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述图谱数据存储方法。根据本申请实施例的第四方面,提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述图谱数据存储方法。本申请实施例的图谱数据存储方法,通过将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质,并在目标图谱数据存储结构的多个行存储结构中分别导入对应的结点数据,实现了以边为中心的图谱数据存储,提高了图谱的完整性,并可以提高图谱数据查询效率。附图说明图1是本申请一示例性实施例示出的一种图谱数据存储方法的流程示意图;图2是本申请一示例性实施例示出的一种目标图谱数据存储结构的示意图;图3是本申请一示例性实施例示出的一种行存储结构的示意图;图4A是本申请一示例性实施例示出的一种属性元组的示意图;图4B是本申请一示例性实施例示出的一种边元组的示意图;图5A是本申请一示例性实施例示出的一种边的示意图;图5B是本申请一示例性实施例示出的一种边数据导入的流程示意图;图6A是本申请一示例性实施例示出的结点1对应的行存储结构中的边1的属性元组的示意图;图6B是本申请一示例性实施例示出的结点1对应的行存储结构中的边1的属性元组的示意图;图7是本申请一示例性实施例示出的一种图谱数据存储装置的结构示意图;图8是本申请有一示例性实施例示出的一种图谱数据存储装置的结构示意图;图9是本申请有一示例性实施例示出的一种图谱数据存储装置的结构示意图;图10是本申请一示例性实施例示出的一种电子设备的硬件结构示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。为了使本领域技术人员更好地理解本申请实施例提供的技术方案,并使本申请实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本申请实施例中技术方案作进一步详细的说明。请参见图1,为本申请实施例提供的一种图谱数据存储方法的流程示意图,如图1所示,该图谱数据存储方法可以包括以下步骤:步骤S100、将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质。本申请实施例中,目标图谱并不特指某一固定图谱,而是可以指代任一需要导入存储介质的图谱,本申请实施例后续不再复述。其中,图谱是指点和边构成的知识网络。本申请实施例中,考虑到传统以结点为中心的图谱数据存储方案可能会由于结点数据无法成功导入而导致对应的边数据无法导入的情况,从而导致所构建的图谱的完整性较差,为了提高图谱的完整性,可以采用以边数据为中心的图谱数据存储方案,即先导入图谱的边数据,然后再导入结点数据。相应地,在本申请实施例中,当需要进行目标图谱数据的存储时,可以先将目标图谱的边数据导入存储介质。其中,本申请实施例中,可以目标图谱数据存储结构的形式存储图谱数据。其中,目标图谱数据存储结构可以包括多个行存储结构,一个行存储结构对应一个结点,该行存储结构用于存储对应的结点的数据以及该结点的相邻边(以该结点作为其中一个端结点的边)的数据。步骤S110、在该多个行存储结构中分别导入对应的结点数据。本申请实施例中,将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质之后,可以得到一个包括目标图谱的全部边数据的表,该表的每一行对应目标图谱的一个结点,但此时,各行仅导入了对应的结点的相邻边的数据,而结点数据尚未导入,因此,为了实现完整的图谱数据导入,可以在目标图谱数据存储结构的各行存储结构中分别导入对应的结点数据。可见,在图1所示方法流程中,通过先导入边数据,后导入结点数据的方式实现图谱数据存储,避免了由于部分结点数据无法成功导入,而导致的该部分结点的相邻边的数据无法成功导入的问题,提高了图谱的完整性。此外,由于采用行存储结构存储结点以及结点的相邻边的数据,实现了结点和其相邻边的一体化存储,由于结点和相邻边数据存在同一行中,查询结点的同时就查询到其所有相邻边,同理,查询边也可以同时查询到其所相邻的两个结点,提高了图谱数据查询效率。在本申请其中一个实施例中,上述将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质,可以包括:对于目标图谱的任一条边,确定该边的两个相邻结点对应的行存储结构是否存在;若存在,则将该边的数据分别导入该边的两个相邻结点对应的行存储结构。在该实施例中,由于一条边存在两个相邻结点(即该边的两个端结点),而目标图谱数据存储结构中一个行存储结构对应一个结点,因此,一条边的数据需要分别导入该边的两个相邻结点对应的行存储结构。同时,本文档来自技高网...

【技术保护点】
1.一种图谱数据存储方法,其特征在于,包括:/n将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质;其中,所述目标图谱数据存储结构包括多个行存储结构,一个所述行存储结构对应一个结点,所述行存储结构用于存储对应的结点的数据以及该结点的相邻边的数据;/n在所述多个行存储结构中分别导入对应的结点数据。/n

【技术特征摘要】
1.一种图谱数据存储方法,其特征在于,包括:
将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质;其中,所述目标图谱数据存储结构包括多个行存储结构,一个所述行存储结构对应一个结点,所述行存储结构用于存储对应的结点的数据以及该结点的相邻边的数据;
在所述多个行存储结构中分别导入对应的结点数据。


2.根据权利要求1所述的方法,其特征在于,所述将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质,包括:
对于所述目标图谱的任一条边,确定该边的两个相邻结点对应的行存储结构是否存在;
若存在,则将该边的数据分别导入该边的两个相邻结点对应的行存储结构。


3.根据权利要求2所述的方法,其特征在于,所述将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质,还包括:
若该边的其中一个相邻结点对应的行存储结构存在,则将该边的数据导入该其中一个相邻结点对应的行存储结构;
创建该边的另一个相邻节点对应的行存储结构,并将该边的数据导入该另一个相邻结点对应的行存储结构。


4.根据权利要求2所述的方法,其特征在于,所述将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质,还包括:
若该边的两个相邻结点对应的行存储结构均不存在,则分别创建该两个相邻结点对应的行存储结构,并将该边的数据分别导入该两个相邻结点对应的行存储结构。


5.根据权利要求1-4任一项所述的方法,其特征在于,对于任一行存储结构,当该行存储结构中未导入结点数据时,该行存储结构对应结点为虚拟结点;
所述在所述多个行存储结构中分别导入对应的结点数据,包括:
向虚拟结点对应的行存储结构导入对应的结点数据。


6.根据权利要求1-4任一项所述的方法,其特征在于,所述行存储结构以对应的结点的标识为主键,通过属性元组存储该结点的属性信息,并通过边元组存储该结点的相邻边的属性信息。


7.一种图谱数据存储装置,其特征在于,包括:
第一存储单元,用于将目标图谱的边数据以目标图谱数据存储结构的形式导入存储介质;其中,所述目标图谱数据存储结构包括多个行存储结构,一个所述行存储结构对应一个结点,所述行存储结...

【专利技术属性】
技术研发人员:葛挺浦世亮姜伟浩闫春
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1