本发明专利技术公开了一种集群存储系统的数据管理方法及系统,属于集群存储技术领域,该方法利用磁盘文件系统存储和管理元数据,数据布局以目录为基本单位进行分布;客户端对数据布局信息进行感知并发出数据访问指令,存储服务器根据客户端的数据访问指令判断查找路径是否为根目录,如是,则选定特定的活动节点作为目标节点进行数据访问;如否,根据路径输入参数计算Hash值,获取数据布局信息,查找目标节点并进行数据访问。本发明专利技术的方法和系统消除了元数据管理的性能瓶颈、单点故障、数据一致性等一系列相关问题,系统扩展性显著提高,系统并发性和性能将实现线性扩展增长。
【技术实现步骤摘要】
本专利技术涉及集群存储
,尤其涉及一种集群存储系统的数据管理方法及系统。
技术介绍
云存储和大数据背景下,非结构化数据呈现爆炸式的增长,面对海量的存储系统,高效的元数据管理和数据定位是个巨大的挑战,直接影响系统的扩展性、性能、可靠性和稳定性等。现有技术方案主要是采用专用元 数据服务来管理元数据,包括集中式和分布式两种模型,数据定位通过向元数据服务器进行查询实现。图I为现有技术中元数据服务模型示意图,如图I所示,图I (a)为集中式元数据服务模型,该模型提供一个中央元数据服务器负责元数据的存储和客户端查询请求,它提供统一的文件系统命名空间,并处理名字解析和数据定位等访问控制功能。传统的NAS系统中,I/O数据流需要经过服务器,而分布式文件系统中,I/O数据流不需要经过元数据服务器,由客户端与存储节点直接交互。这个架构上的变革,使得控制流与数据流分离开来,元数据服务器和存储服务器各司其职,系统扩展性和性能上获得了极大的提升。显而易见,集中式元数据服务模型的最大优点就是设计实现简单,本质上相当于设计一个单机应用程序,对外提供网络访问接口即可,如Socket, RPC, HTTP REST或SOAP等。元数据服务设计实现的关键是OPS吞吐量,即单位时间处理的操作数,这对集中式元数据服务模型尤其关键,因为会受到系统Scale-Up方面的限制。为了优化0PS,该模型对CPU、内存、磁盘要求较高,条件允许的情况下尽量使用高性能CPU、大内存和高速磁盘,甚至后端存储可考虑使用高端磁盘阵列或SSD。在软件架构方面设计,应该考虑多进程/线程(池)、异步通信、Cache、事件驱动等实现机制。但集中式元数据服务模型存在性能瓶颈和单点故障问题。性能瓶颈,这种模型下元数据服务器在负载不断增大时将很快成为整个系统性能的瓶颈。根据Amdahl定律,系统性能加速比最终受制于串行部分的比重,这决定了系统使用并行手段所能改进性能的潜力。这里,元数据服务器就是串行的部分,它直接决定着系统的扩展规模和性能。文件元数据的基本特性要求它必须同步地进行维护和更新,任何时候对文件数据或元数据进行操作时,都需要同步更新元数据。客户端访问分布式文件系统时,都需要先与元数据服务器进行交互,这包括命名空间解析、数据定位、访问控制等,然后才直接与存储节点进行I/O交互。随着系统规模不断扩大,存储节点、磁盘数量、文件数量、客户端数据、文件操作数量等都将急剧增加,而运行元数据服务器的物理服务器性能毕竟终究有限,因此集中式元数据服务器将最终成为性能瓶颈。单点故障(SPOF, Single Point of Failure),这个问题比性能瓶颈更加严重。整个系统严重依赖于元数据服务器,一旦出现问题,系统将变得完全不可用,直接导致应用中断并影响业务连续性。物理服务器所涉及的网络、计算和存储部件以及软件都有可能发生故障,因此单点故障问题潜在的,采用更优的硬件和软件只能降低发生的概率而无法避免。目前,SPOF问题主要是采用HA机制来解决,根据可用性要求的高低,镜像一个或多个元数据服务器(逻辑的或物理的均可),构成一个元数据服务HA集群。集群中一台作为主元数据服务器,接受和处理来自客户端的请求,并与其他服务器保持同步。当主元数据服务器发生问题时,自动选择一台可用服务器作为新的主服务器,这一过程对上层应用是透明的,不会产生业务中断。HA机制能够解决SPOF问题,但同时增加了成本开销,只有主服务器是活动的,其他服务器均处于非活动状态,对性能提升没有任何帮助。图I (b)为分布式元数据服务模型,即使用多台服务器构成集群协同为分布式文件系统提供元数据服务,从而消除集中式元数据服务模型的性能瓶颈和单点故障问题。这种模型可以细分为两类,一为全对等模式,即集群中的每个元数据服务器是完全对等的,每个都可以独立对外提供元数据服务,然后集群内部进行元数据同步,保持数据一致性,比如ISILON.LoongStore.CZSS等。另一类为全分布模式,集群中的每个元数据服务器负责部分元数据服务(分区可以重叠),共同构成完整的元数据服务,比如PanFS,GPFS, Ceph等。分布式元数据服务模型,将负载分散到多 台服务器解决了性能瓶颈问题,利用对等的服务器或冗余元数据服务分区解决了单点故障问题。分布式看似非常完善,然而它大大增加了设计实现上的复杂性,同时可能会引入了新的问题,即性能开销和数据一致性问题。性能开销,分布式系统通常会引由于节点之间的数据同步而引入额外开销,这是因为同步过程中需要使用各种锁和同步机制,以保证数据一致性。如果节点同步问题处理不当,性能开销将对系统扩展性和性能产生较大影响,和集中式元数据模型一样形成性能瓶颈,这就对分布式元数据服务器的设计提出了更高的要求。这种性能开销会抵消一部分采用分布式所带来的性能提升,而且随着元数据服务器数量、文件数量、文件操作、存储系统规模、磁盘数量、文件大小变小、I/o操作随机性等增加而加剧。另外,元数据服务器规模较大时,高并发性元数据访问会导致同步性能开销更加显著。目前,一些分布式文件系统采用高性能网络(如InfiniBand,GibE等)、SSD固态硬盘或SAN磁盘阵列、分布式共享内存(SMP或ccNUMA)等技术进行集群内部的元数据同步和通信。这的确可以明显提高系统性能以抵消同步开销,不过成本方面也徒然增加许多。数据一致性,这是分布式系统必须面对的难题。分布式元数据服务模型同样面临潜在的系统发生错误的风险,虽然一部分元数据节点发生故障不会致使整个系统宕机,但却可能影响整个系统正常运行或出现访问错误。为了保证高可用性,元数据会被复制到多个节点位置,维护多个副本之间的同步具有很高的风险。如果元数据没有及时同步或者遭受意外破坏,同一个文件的元数据就会出现不一致,从而导致访问文件数据的不一致,直接影响到上层数据应用的正确性。这种风险发生的概率随着系统规模的扩大而大幅增加,因此分布式元数据的同步和并发访问是个巨大的挑战。使用同步方法对元数据进行同步,再结合事务或日志,自然可以解决数据一致性问题,然而这大大降低了系统的并发性,违背了分布式系统的设计初衷。在保证元数据一致性的前提下,尽可能地提高并发性,这就对同步机制和算法设计方面提出了严格要求,复杂性和挑战性不言而喻。分布式元数据服务模型虽然解决了集中式数据服务模型中存在的问题,但同时引入了设计复杂性、性能开销和元数据同步一致性等问题。这些问题直接影响到系统性能和扩展性。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷和不足,提供一种集群存储系统的数据管理方法及系统,消除了上述元数据管理的性能瓶颈、单点故障、数据一致性等一系列相关问题。为达到上述目的,本专利技术是通过以下技术方案来实现的一种集群存储系统的数据管理方法,该方法基于包括客户端和存储服务器集群的系统实现,包括数据存储和访问的操作,所述数据存储的操作包括利用磁盘文件系统存储元数据,数据布局以目录为基本单位进行分布并分配Hash范围,其中,文件的父目录利用扩展属性 记录存储节点的映射关系,子文件在父目录所属存储节点中进行分布;所述方法基于所述数据布局进行数据访问操作,其中,所述数据访问操作包括SI :客户端对数据布局信息进行感知并发出数据访问本文档来自技高网...
【技术保护点】
一种集群存储系统的数据管理方法,该方法基于包括客户端和存储服务器集群的系统实现,包括数据存储和访问的操作,其特征在于,所述数据存储的操作包括:利用磁盘文件系统存储元数据,数据布局以目录为基本单位进行分布并分配Hash范围,其中,文件的父目录利用扩展属性记录存储节点的映射关系,子文件在父目录所属存储节点中进行分布;所述方法基于所述数据布局进行数据访问操作,其中,所述数据访问操作包括:S1:客户端对数据布局信息进行感知并发出数据访问指令,集成服务器根据客户端的数据访问指令判断查找路径是否为根目录,如是,则执行步骤S2,如否,执行步骤S3;S2:选定特定的活动节点作为目标节点进行数据访问;S3:根据路径输入参数计算Hash值,获取数据布局信息,查找目标节点并进行数据访问。
【技术特征摘要】
【专利技术属性】
技术研发人员:刘爱贵,
申请(专利权)人:北京联创信安科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。