The application relates to the field of communication technology, and discloses a method and device for message transmission in a clustered file system to ensure normal communication between hosts when a message network fails. The method is as follows: the first host in the cluster file system determines that the message network link fails, switches the message network link for message transmission to a storage channel, generates the first message, and records the first message in the first location area of the data storage medium, and the first location area is used for the second host access. Ask and read the first message.
【技术实现步骤摘要】
一种集群文件系统中消息传输的方法及装置
本申请涉及通信
,特别涉及一种集群文件系统中消息传输的方法及装置。
技术介绍
随着高性能、高可靠的存储区域网络(StorageAreaNetwork,SAN)设备的普及,采用集中式的共享存储已经成为许多分布式系统的首选。尤其在服务器虚拟化平台下,多主机共享互连网协议的存储区域网络(Internet-ProtocolStorageAreaNetwork,IP-SAN)和网状通道的存储区域网络(Fibre-ChannelStorageAreaNetwork,FC-SAN)存储是最常见的形态。为了支持更加丰富的存储应用,通常需要在共享存储上部署集群文件系统,以供各主机灵活、快捷地使用共享存储。集群文件系统是指运行在多台计算机(即主机)之上,各主机之间通过某种方式相互通信,从而将集群内所有存储空间资源整合、虚拟化,并对外提供文件访问服务的文件系统。集群文件系统依赖于主机间的通信,主机间交换消息来实现某一协议,保证对共享存储的非冲突访问。目前最主流的主机间通信方式是主机间通过消息网络收发消息的方式来传递消息。消息网络是大部分集群文件系统中最为重要的组成部分之一。然而,消息网络本身并不是可靠的,容易受到各种网络故障,如链路中断、IP冲突、交换机故障等影响。而且在实际部署时,受限于网卡、交换机的数量,通常将集群文件系统的消息网络与业务网络部署于同一平面,一旦业务消息流量过大,就容易影响集群文件系统消息网络的可用性,诱发消息网络瞬时或长期故障。对于集群文件系统而言,消息网络的故障通常是致命的。为了保证集群文件系统的数据与元数据 ...
【技术保护点】
1.一种集群文件系统中消息传输的方法,其特征在于,所述集群文件系统包括第一主机、第二主机、消息网络链路和数据存储介质,所述消息网络链路用于所述第一主机与所述第二主机之间进行消息传输,所述数据存储介质用于存储所述集群文件系统的文件信息,包括:所述第一主机确定所述消息网络链路发生故障,将进行消息传输的通道由所述消息网络链路切换到存储通道,所述存储通道用于连接所述第一主机与所述数据存储介质,以及连接所述第二主机与所述数据存储介质,以便于所述第一主机与所述第二主机通过所述数据存储介质进行消息传输;所述第一主机生成待向所述第二主机发送的第一消息,并将所述第一消息记录在所述数据存储介质的第一位置区域,所述第一位置区域用于所述第二主机访问并读取所述第一消息。
【技术特征摘要】
1.一种集群文件系统中消息传输的方法,其特征在于,所述集群文件系统包括第一主机、第二主机、消息网络链路和数据存储介质,所述消息网络链路用于所述第一主机与所述第二主机之间进行消息传输,所述数据存储介质用于存储所述集群文件系统的文件信息,包括:所述第一主机确定所述消息网络链路发生故障,将进行消息传输的通道由所述消息网络链路切换到存储通道,所述存储通道用于连接所述第一主机与所述数据存储介质,以及连接所述第二主机与所述数据存储介质,以便于所述第一主机与所述第二主机通过所述数据存储介质进行消息传输;所述第一主机生成待向所述第二主机发送的第一消息,并将所述第一消息记录在所述数据存储介质的第一位置区域,所述第一位置区域用于所述第二主机访问并读取所述第一消息。2.如权利要求1所述的方法,其特征在于,还包括:所述第一主机监控所述消息网络链路,并在确定所述消息网络链路恢复正常后,将进行消息传输的通道由所述存储通道切换到所述消息网络链路。3.如权利要求1或2所述的方法,其特征在于:所述集群文件系统中包括N台主机,所述数据存储介质中包括N阶方阵,所述N阶方阵中第i行第j列的元素代表第ij位置区域,所述第ij位置区域用于第i台主机记录向第j台主机发送的消息,以及用于所述第j台主机访问并读取所述第i台主机记录的消息;其中,N≥2,1≤i≤N,1≤j≤N,i、j、N均为正整数,i≠j。4.如权利要求1~3任一项所述的方法,其特征在于,所述方法还包括:所述第一主机访问所述数据存储介质的第二位置区域,并读取所述第二主机记录在所述第二位置区域的第二消息。5.如权利要求4所述的方法,其特征在于,所述第一主机访问所述数据存储介质的第二位置区域,并读取所述第二主机记录在所述第二位置区域的第二消息包括:所述第一主机访问所述数据存储介质的第二位置区域,查询所述第二位置区域的头部区域承载的第一索引和第二索引,根据所述第一索引和所述第二索引,判定存在未读消息时,读取所述未读消息;其中,所述第一索引用于表征在所述第二位置区域中所述第一主机读取消息的位置,所述第二索引用于表征在所述第二位置区域中所述第二主机记录消息的位置。6.一种集群文件系统中消息传输的装置,其特征在于,所述装置应用于第一主机,所述集群文件系统包括所述第一主机、第二主机、消息网络链路和数据存储介质,所述消息网络链路用于所述第一主机与所述第二主机之间进行消息传输,所述数据...
【专利技术属性】
技术研发人员:傅唯威,沈灿泉,吴斌,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。