一种分布式存储系统哈希索引的构建方法和装置制造方法及图纸

技术编号:38012019 阅读:5 留言:0更新日期:2023-06-30 10:33
本公开提供了一种分布式存储系统哈希索引的构建方法和装置,涉及人工智能领域,尤其涉及云计算、云存储和云数据库等技术领域,可应用在智能云场景下。具体实现方案为:创建用于存储内存数据对应的文件,并为所述文件构建对应的哈希索引;获取所述文件的信息类型;根据所述信息类型构建所述哈希索引的索引值。通过本公开可以提升存储系统的性能,提升云服务的竞争力。的竞争力。的竞争力。

【技术实现步骤摘要】
一种分布式存储系统哈希索引的构建方法和装置


[0001]本公开涉及人工智能领域,尤其涉及云计算、云存储和云数据库等
,可应用在智能云场景下,具体涉及一种分布式存储系统哈希索引的构建方法、装置、电子设备、存储介质及产品。

技术介绍

[0002]分布式文件系统可以为用户提供安全、可扩展的文件存储服务,通过标准的文件访问协议,为云上的虚机、容器等计算资源提供无限扩展、高可靠、高性能的文件存储能力。
[0003]随着文件系统规模的扩大,分布式文件存储系统的性能要求也越来越高。

技术实现思路

[0004]本公开提供了一种分布式存储系统哈希索引的构建方法、装置、电子设备、存储介质及产品。
[0005]根据本公开的第一方面,提供了一种分布式存储系统哈希索引的构建方法,包括:
[0006]创建用于存储内存数据对应的文件,并为所述文件构建对应的哈希索引;获取所述文件的信息类型;根据所述信息类型构建所述哈希索引的索引值。
[0007]根据本公开的第二方面,提供了一种分布式存储系统哈希索引的构建装置,所述装置包括:
[0008]创建模块,用于创建用于存储内存数据对应的文件,并为所述文件构建对应的哈希索引;获取模块,用于获取所述文件的信息类型;构建模块,用于根据所述信息类型构建所述哈希索引的索引值。
[0009]根据本公开的第三方面,提供了一种电子设备,包括:
[0010]至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面或第二方面所述的方法。
[0011]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面或第二方面所述的方法。
[0012]根据本公开的第五方面,提供了一种计算机产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面或第二方面所述的方法。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0015]图1示出了本公开实施例提供的一种布式存储系统哈希索引的构建方法的流程示意图;
[0016]图2示出了本公开实施例提供的一种获取内存数据对应的文件的方法的流程示意图;
[0017]图3示出了本公开实施例提供的一种创建用于存储内存数据对应的文件的方法的流程示意图;
[0018]图4示出了本公开实施例提供的一种分布式存储系统哈希索引的构建装置的结构示意图;
[0019]图5示出了可以用来实施本公开的实施例的示例电子设备的示意性框图。
具体实施方式
[0020]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0021]分布式文件系统可以为用户提供安全、可扩展的文件存储服务,通过标准的文件访问协议,为云上的虚机、容器等计算资源提供无限扩展、高可靠、高性能的文件存储能力。随着文件系统规模的扩大,分布式文件存储系统的性能要求也越来越高,尤其是在数据查找过程中。
[0022]相关技术中,分布式存储系统的索引主要用于存储用户逻辑数据到物理数据的映射,一般索引的最小单位是4k,常见的索引结构是树形索引,例如日志结构化合并树(Log

Structured

Merge

Tree,LSM tree),LSM tree是一种多级存储的方式,数据的访问可能在内存表(memtable)中,也可能在磁盘的N级排序字符串(Sorted String Table,SST)上。
[0023]但是相关技术中存在读放大的问题,并且在压缩(Compaction)数据文件的时候有写放大,磁盘利用率较低等问题。
[0024]根据上述技术问题,本公开提供一种布式存储系统哈希索引的构建方法和装置。通过为分布式存储系统的磁盘中的文件,构建相应的哈希索引,在保证存储系统高可靠、高可用的条件下,可以提升存储系统的性能,提升云服务的竞争力。
[0025]需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0026]图1示出了本公开实施例提供的一种布式存储系统哈希索引的构建方法的流程示意图,如图1中所示,该方法可以包括:
[0027]在步骤S110中,创建用于存储内存数据对应的文件,并为所述文件构建对应的哈希索引。
[0028]在本公开实施例中,分布式存储系统可用于存储图片、视频等非结构化数据对象,例如:Blob对象、定长块以及大文件。
[0029]本公开提供的实施例适用于单机存储和/或查询数据,当然也可用于其他场景中。
[0030]本实施例中,操作系统可以根据数据的映射关系,将内存数据映射写入文件中。进一步可以为每个文件构建对应的哈希索引。
[0031]在步骤S120中,获取所述文件的信息类型。
[0032]在本公开实施例中,将内存数据映射至对应的文件中,可以确定该文件的信息类型。其中,信息类型可以是属性信息、数据信息等类型。
[0033]在步骤S130中,根据所述信息类型构建所述哈希索引的索引值。
[0034]在本公开实施例中,根据文件的信息类型,对应为该文件构建相应的哈希索引的索引值。
[0035]通过本公开实施例提供的分布式存储系统哈希索引的构建方法,为内存数据构建文件,并将内存数据映射至对应的文件中,降低了数据序列化的开销。为分布式存储系统的磁盘中的文件,构建相应的哈希索引,在保证存储系统高可靠、高可用的条件下,可以提升存储系统的性能,提升云服务的竞争力。并且,通过哈希索引进行数据的访问,速度快,也没有额外的读写放大,极大提升了存储系统的性能。
[0036]在本公开中,可以为分布式存储系统中的每个副本数据所在文件构建对应的哈希索引。其中,相同的数据可以分布式存储与不同的存储设备中。
[0037]图2示出了本公开实施例提供的一种获取内存数据对应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分布式存储系统哈希索引的构建方法,包括:创建用于存储内存数据对应的文件,并为所述文件构建对应的哈希索引;获取所述文件的信息类型;根据所述信息类型构建所述哈希索引的索引值。2.根据权利要求1所述的方法,其中,所述获取内存数据对应的文件,包括:获取分布式存储系统中内存数据的至少一个副本数据;获取每个所述副本数据对应的切片数据所在的文件。3.根据权利要求1所述的方法,其中,所述根据所述信息类型构建所述哈希索引的索引值,包括:响应于所述信息类型为属性信息,将所述文件的索引节点作为所述哈希索引的密钥,将所述文件的属性作为所述哈希索引的索引值。4.根据权利要求1所述的方法,其中,所述根据所述信息类型构建所述哈希索引的索引值,包括:响应于所述信息类型为数据信息,将所述文件的索引节点及其数据偏移量作为所述哈希索引的密钥,将所述文件的存储名称作为所述哈希索引的索引值。5.根据权利要求1所述的方法,其中,所述创建用于存储内存数据对应的文件,包括:根据所述内存数据申请存储空间;创建文件,将存储空间中的数据映射至所述文件中,并将所述内存数据的相关元信息写入所述文件头信息。6.根据权利要求1所述的方法,其中,所述根据所述信息类型构建所述哈希索引的索引值之后,所述方法还包括:基于所述索引值,查找分布式存储系统中的内存数据。7.一种分布式存储系统哈希索引的构建装置,所述装置包括:创建模块,用于创建用于存储内存数据对应的文件,并为所述文件构建对应的哈希索引;获取模块,用于获取所述文件的信息类型;构建模块,用于根据所述信息类型构建所述哈希索引的索引值。8.根据权利要求7所述的装置,其中,...

【专利技术属性】
技术研发人员:陈诚
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1