计算机存储介质、分布式系统及其控制方法、以及节点技术方案

技术编号:14620344 阅读:154 留言:0更新日期:2017-02-10 11:59
一种包括在网络上连接的多个节点的分布式系统。每个节点具有在分布式系统中标识节点的唯一标识符。任务从分布式系统中的任何节点启动并且包括唯一标识符。如果节点接收到包括节点的唯一标识符的任务,则节点执行该任务。每个节点将每个任务存储在日志中。如果节点故障,则在从故障中恢复之后,节点向分布式系统查询由于该故障而没有接收到的任务以及没有完成的任务。任务可以基于通过使用带内访问指定存储与元数据对应的数据的节点的位置的元数据而得到的位置数据来在节点上启动。任务可以包括开启虚拟机以使得IP地址在配置虚拟机的文件中被编码。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总体上涉及计算机系统,并且更具体而言涉及用于操作联网的设备或节点的分布式系统的技术。
技术介绍
为了提供分布式文件系统的大小和带宽的可扩展性,传统的存储系统将文件的存储分散在分布式存储系统中的多个存储节点上。传统上,虽然存储节点中的文件存储已经被散布,但是,文件系统的管理、处理以及文件元数据被集中在控制节点或任务管理节点中。在传统的分布式文件系统中,用于定位文件系统内的数据的方法已经使用被当作“带外”或者不由通常用于访问文件系统的协议支持的机制。带外机制的一个示例用在ParaScaleTM分布式存储平台中。在ParaScaleTM分布式存储平台中,集中式任务管理器或主设备打开经由网络文件系统(NFS)导出的挂载点上的文件,使用“stat”操作来获得关于文件的关键信息,并且接着使用文件的关键信息、接收到的诸如为服务器的地址之类的数据位置的可扩展标记语言(XML)信息来在控制节点上传送数据位置服务。ParaScaleTM平台的客户端接着能够使用服务器的地址来启动数据任务。如上所记载的,传统的分布式文件系统使用负责协调所有节点上的任务的集中式任务管理器。典型地,任务管理器引导其他节点执行任务。虽然这样的配置允许以已知顺序来执行任务,但是,如果任务管理器故障,则分布式文件系统的弹性(resiliency)将受损,因为任务管理器必须在能够启动附加的任务之前从故障中恢复。进而,待定任务的日志传统上已经放置在共享永久性存储器上或者在多个节点之间被复制。因此,任务管理器造成作为针对分布式文件系统的单个故障点的问题。在分布式系统中,系统中的节点的IP地址分配传统上由动态主机配置协议(DHCP)处理。如果在分布式系统中存在虚拟机,则DHCP造成的问题在于DHCP一般性地向网络中的所有系统分配IP地址。结果,DHCP中存在关于对能够被容易地隔离以仅向存在于分布式系统中的虚拟机提供IP地址的DHCP服务器进行配置的问题。
技术实现思路
本专利技术的实施方式总体上涉及一种分布式计算机系统,并且更具体而言,涉及用于在分布式存储系统(这里“集群”)中管理任务的发出的技术,包括用于确定应该启动特定任务的分布式存储系统中的位置、创建具有可靠IP地址的虚拟机的任务、以及分布式存储系统中的任务的错误恢复的技术。鉴于传统分布式系统中的问题,在本专利技术的某些实施方式中,配置集群以使得任务能够从集群中的任意节点向集群中的任意其他或所有其他节点发出,并且能够以弹性和容错特性来存储和执行任务。例如,集群采用一致(consensus)算法,诸如用于实现容错分布式系统的Paxos算法,由此能够以已知顺序在集群中的每个节点、节点的子集或所有节点上分发和处理任务。在某些实施方式中,如果节点由于故障等而脱机,并且为脱机节点定义了任务,则当节点回到在线(例如,从故障中恢复)时必须运行该任务。通过使用一致算法,待定任务作为一个或多个有序消息而从集群中的任意节点启动并且广播到集群中的所有节点。例如,可以使用诸如为这里通过引用并入的“PaxosMadeSimpleSIGACTNews,第32卷,第4期(2001年12月),第51-58页,LeslieLamport”中描述的一致算法、或者其变型的一致算法。结果,之前的实施方式有利地提供了允许容错和节点弹性的分散型分布式系统。另外,在本专利技术的其他实施方式中,当在集群中的节点上启动开启虚拟机(VM)的任务时,包含虚拟机的具体特性的配置文件被引用,该配置文件包括将由虚拟机使用的介质接入控制(MAC)地址。根据本专利技术的各种实施方式,将由虚拟机使用的IP地址被编码在MAC地址中。结果,VM能够被给予不与集群中使用的其他IP地址冲突的诸如为IPv4的IP地址,并且不需要依赖于动态主机配置协议(DHCP)服务器来尝试向虚拟机分配IP地址。结果,前述实施方式有利地允许使用MAC地址作为从主机节点通过管理程序(hypervisor)向虚拟机通信IP地址的管道来为虚拟机设置IP地址。再进一步地,在本专利技术的又一实施方式中,文件系统具有其中每个文件具有对应的映射文件的、扩展的命名空间,该对应的映射文件具有指定该文件在集群中的数据位置的特殊扩展。通过扩展命名空间以包括用以指定映射文件的特殊扩展,能够使用典型地用于访问存储在文件系统中的数据的诸如为网络文件系统(NFS)v3.1的协议来在文件系统中访问映射文件。然而,映射文件在文件系统的正常目录列表中会不可见。结果,前述实施方式有利地允许使用用于访问数据自身的相同的机制来访问集群中的数据的位置信息。附图说明图1为根据本专利技术的实施方式的集群式计算机系统的框图。图2为根据本专利技术的实施方式的客户端的框图。图3为根据本专利技术的实施方式的节点的框图。图4为根据本专利技术的实施方式的节点的存储设备的详细框图。图5为根据本专利技术的实施方式的节点的信道板的框图。图6为根据本专利技术的实施方式的节点的处理器板的框图。图7为根据本专利技术的实施方式的节点的驱动板的框图。图8A、8B以及8C为根据本专利技术的实施方式的客户端对文件系统的访问的框图。图9A、9B以及9C为根据本专利技术的实施方式的节点的存储设备的框图。图10为根据本专利技术的实施方式的节点的功能框图。图11A为根据本专利技术的实施方式的管理表。图11B为根据本专利技术的实施方式的任务日志。图12为根据本专利技术的实施方式的节点的网络层、任务队列层以及执行层的抽象框图。图13为根据本专利技术的实施方式的UUID分配过程。图14为根据本专利技术的实施方式的任务执行过程。图15为根据本专利技术的实施方式的节点重启过程。图16示出了根据本专利技术的实施方式的经编码的MAC地址的结构。图17为根据本专利技术的实施方式的IP地址编码示图。图18为根据本专利技术的实施方式的管理程序层、MAC/IP层以及虚拟机层的抽象框图。图19为根据本专利技术的实施方式的配置过程。图20为根据本专利技术的实施方式的文件系统的框图。图21为根据本专利技术的实施方式的文件、映射文件以及位置响应的示图。图22示出了根据本专利技术的实施方式的文件与映射文件之间的关系。图23为根据本专利技术的实施方式的用于更新文件属性和元数据的处理流程。图24为根据本专利技术的实施方式的客户端对映射文件的访问的处理流程。图25为根据本专利技术的实施方式的客户端本文档来自技高网
...

【技术保护点】
一种非瞬态计算机可读介质,在其上存储有可执行指令,其中所述可执行指令使具有多个节点的分布式系统执行一种方法,所述方法包括:向所述多个节点中的每个节点分配唯一标识符;从所述节点中的一个节点向所述分布式系统广播包括所述节点的一个或多个唯一标识符的任务;在每个节点处存储广播的所述任务;针对所述节点中的每个节点,如果所述任务中的所述一个或多个唯一标识符包括相应的所述节点的所述唯一标识符则执行所述任务;以及从执行所述任务的每个节点向所述分布式系统广播完成消息。

【技术特征摘要】
【国外来华专利技术】1.一种非瞬态计算机可读介质,在其上存储有可执行指令,其
中所述可执行指令使具有多个节点的分布式系统执行一种方法,所
述方法包括:
向所述多个节点中的每个节点分配唯一标识符;
从所述节点中的一个节点向所述分布式系统广播包括所述节点
的一个或多个唯一标识符的任务;
在每个节点处存储广播的所述任务;
针对所述节点中的每个节点,如果所述任务中的所述一个或多
个唯一标识符包括相应的所述节点的所述唯一标识符则执行所述任
务;以及
从执行所述任务的每个节点向所述分布式系统广播完成消息。
2.根据权利要求1所述的非瞬态计算机可读介质,其中所述唯
一标识符为通用唯一标识符(UUID)。
3.根据权利要求1所述的非瞬态计算机可读介质,所述方法进
一步包括:
在所述节点中的一个节点处从连接到所述分布式系统的客户端
接收所述任务。
4.根据权利要求1所述的非瞬态计算机可读介质,所述方法进
一步包括:
如果所述任务中的所述一个或多个唯一标识符包括相应的所述
节点的所述唯一标识符,则在相应的所述节点处执行所述任务之前
将所述任务放入相应的所述节点的队列中。
5.根据权利要求1所述的非瞬态计算机可读介质,其中每个节
点在日志中存储广播的所述任务与时间戳。
6.根据权利要求5所述的非瞬态计算机可读介质,所述方法进
一步包括:
如果所述任务中的所述一个或多个唯一标识符包括相应的所述

\t节点的所述唯一标识符,则当相应的所述节点开始执行所述任务时,
广播开始消息。
7.根据权利要求6所述的非瞬态计算机可读介质,其中每个节
点与所述开始消息中指示的时间和所述完成消息中指示的时间相对
应地存储广播的所述任务。
8.根据权利要求1所述的非瞬态计算机可读介质,其中,所述
节点中的第一节点由于故障而不能接收广播的所述任务。
9.根据权利要求8所述的非瞬态计算机可读介质,所述方法进
一步包括:
在所述第一节点已经从所述故障中恢复之后,在所述第一节点
处从所述节点中的一个或多个节点接收广播的所述任务;以及
在所述第一节点已经从所述故障中恢复之后,在所述第一节点
处存储广播的所述任务。
10.一种非瞬态计算机可读介质,在其上存储有可执行指令,
其中所述可执行指令使处理器执行分配IP地址的方法,所述方法包
括:
在MAC地址中编码IP地址;
配置虚拟机以具有经编码的所述MAC地址;
从经编码的所述MAC地址中解码所述IP地址;以及
向所述虚拟机分配经解码的所述IP地址。
11.根据权利要求10所述的非瞬态计算机可读介质,其中所述
IP地址包括在所述MAC地址的低部分。
12.根据权利要求10所述的非瞬态计算机可读介质,所述方法
进一步包括:
在用于配置所述虚拟机的配置文件中存储经编码的所述MAC
地址。
13.根据权利要求10所述的非瞬态计算机可读...

【专利技术属性】
技术研发人员:D·S·哈特曼T·A·格拉斯S·辛哈B·伯恩哈德O·基塞勒夫J·马特利
申请(专利权)人:日立数据系统工程英国有限公司
类型:发明
国别省市:英国;GB

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1