【技术实现步骤摘要】
一种分布式存储系统的数据分布控制方法、系统及装置
本专利技术涉及分布式存储系统,更具体地,涉及一种分布式存储系统的数据分布控制方法及系统、装置。
技术介绍
当前的大规模分布式存储系统中,为了实现在某个容错域出现问题时数据仍然可以被访问到,采用数据多个副本跨容错域存储的方式,以抵御单个容错域故障导致的数据可用性问题。例如,Hadoop分布式文件系统(HDFS:HadoopDistributedFileSystem)中,将数据的多个副本分布到不同的机架进行存储。HDFS中一个机架构成一个容错域(也称为错误域),容错域代表出错的一个物理单元,通过将容错域放置在不同机架中,在某个机架的电源或者相应交换机出现故障时,仍然可以访问数据。有些分布式存储系统会跨地域分布,在一个国家区域范围内,也会出现某个地域的供电或者网络基础设施出现故障,导致存储系统在地域内的数据不可访问,进而引起上层应用的故障。相关技术进行分布式存储系统的数据分布控制时,先收集分布式存储系统的拓扑关系,生成整个分布式存储系统中存储节点间的拓扑关系,并自动划分好容错域。在创建数据时,指定数据要写入的副本数量,将数据的多个副本保存在多个容错域中即跨容错域分布。当有容错域出现故障导致数据的副本缺失时,可以通过数据复制过程恢复数据的副本数。本申请的专利技术人发现,上述数据分布控制方法实际是认为容错域是等价的,容错域间网络带宽相同,单位价格一样,且容错域间网络传输的延迟是一样的。但是实际情况并非如此,例如在一个分层网络架构下的数据中心内部,同一机架下机器间的网络带宽可以达到网卡带宽,延迟在0.3ms以内,但是在 ...
【技术保护点】
1.一种分布式存储系统的数据分布控制方法,包括:从分布式存储系统提供的多种分布策略中确定第一数据采用的分布策略,所述多种分布策略包括跨容错域分布的策略和在一个容错域内分布的策略;根据采用的所述分布策略和分布式存储系统的拓扑关系,为所述第一数据分配容错域并进行数据写入。
【技术特征摘要】
1.一种分布式存储系统的数据分布控制方法,包括:从分布式存储系统提供的多种分布策略中确定第一数据采用的分布策略,所述多种分布策略包括跨容错域分布的策略和在一个容错域内分布的策略;根据采用的所述分布策略和分布式存储系统的拓扑关系,为所述第一数据分配容错域并进行数据写入。2.如权利要求1所述的方法,其特征在于:从分布式存储系统提供的多种分布策略中确定第一数据采用的分布策略,包括:根据所述第一数据的可用性要求,确定所述第一数据采用的分布策略;或者将用户为所述第一数据指定的分布策略,确定为所述第一数据采用的分布策略;或者根据用户为所述第一数据指定的一个或多个容错域,确定所述第一数据采用的分布策略。3.如权利要求2所述的方法,其特征在于:根据所述第一数据的可用性要求,确定所述第一数据采用的分布策略,包括:如第一数据为要求在单个容错域故障时仍可访问的高可用数据,确定所述第一数据采用跨容错域分布的策略;如第一数据为在容错域故障时可停止访问并重新生成的低可用数据,确定所述第一数据采用在一个容错域内分布的策略;所述第一数据的可用性要求根据系统默认配置或用户定制或外部系统的指示确定。4.如权利要求1所述的方法,其特征在于:所述分布式存储系统划分有机器层、接入层、汇聚层、数据中心层和地域层中的一个或多个层次的容错域。5.如权利要求1所述的方法,其特征在于:所述确定第一数据采用的分布策略,包括:在确定所述第一数据采用跨容错域分布的策略时,还根据系统默认配置或用户定制确定所跨的容错域的层次。6.如权利要求1-5中任一所述的方法,其特征在于:所述第一数据采用在一个容错域内分布的策略时,根据采用的所述分布策略和分布式存储系统的拓扑关系,为所述第一数据分配容错域并进行数据写入,包括:为所述第一数据分配所述第一数据的生成者所在的容错域,且优先将所述第一数据的多个副本写入所分配容错域内的同一存储节点。7.如权利要求1-5中任一所述的方法,其特征在于:所述第一数据采用跨容错域分布的策略时,根据采用的所述分布策略和分布式存储系统的拓扑关系,为所述第一数据分配容错域并进行数据写入,包括:采用同时写入方式,在分布式存储系统正常容错域的数量M大于或等于采用的所述分布策略要求的容错域数量N时,为所述第一数据分配N个容错域并同时写入;在M<N时,为所述第一数据分配M个容错域并同时写入,在正常容错域的数量达到N个后,再通过数据复制使所述第一数据分布到N个容错域,其中N,M为正整数,N≥2;或者采用分时写入方式,先将所述第一数据写入到分配的一个容错域,再通过数据复制使所述第一数据分布到N个容错域。8.如权利要求4所述的方法,其特征在于:为所述第一数据分配容错域并进行数据写入之后,所述方法还包括:因机器层的容错域故障导致所述第一数据的副本缺失时,立即发起数据复制以补充所述第一数据缺失的副本;除机器层之外其他层的容错域故障导致所述第一数据的副本缺失时,先经过设定的故障等待时间,所述故障等待时间到时后,如所述故障还未排除,再发起数据复制以补充所述第一数据缺失的副本。9.如权利要求4所述的方法,其特征在于:为所述第一数据分配容错域并进行数据写入之后,所述方法还包括:在所述第一数据的副本缺失而发起的数据复制过程中,先确定数据复制的源位置和目标位置,在所述源位置到目标位置经过的每一层次的容错域上申请相应的流量额度,申请成功后再开始数据复制。10.如权利要求1所述的方法,其特征在于:从分布式存储系统提供的多种分布策略中确定第一数据采用的分布策略,包括以下确定方式中的一种或多种:所述第一数据为要存储在高可用云盘的数据时,采用跨域分布的策略;所述第一数据为要存储在低可用云盘的数据时,采用在同一容错域内分布的策略;根据第一数据相关的服务等级协议确定第一数据采用的分布策略,其中,在所述服务等级协议大于等于99.9%时,确定所述第一数据采用跨域分布的策略;所述第一数据为大数据计算的输入输出数据时,采用跨域分布策略;所述第一数据为大数据计算产生的中间数据时,采用在一个容错域内分布的策略。11.如权利要求7所述的方法,其特征在于:所述第一数据为数据库备份数据时,采用分时写入方式;所述第一数据为数据库备份时产生的状态信息的数据时,采用同时写入方式。12.一种分布式存储系统中的数据分布控制系统,包括策略确定模块和分配及写入模块,其特征在于:所述策略确定模块设置为:从分布式存储系统提供的多种分布策略中确定第一数据采用的分布策略,所述多种分布策略包括跨容错域分布的策略和在一个容错域内分布的策略;所述分配及写入模块设置为:根据采用的所述分布策略和分布式存储系统的拓扑关系,为所述第一数据分配容错域并进行数据写入。13.如权利要求12所述的分布控制系统,其特征在于:所述策略确定模块从分布式存储系统提...
【专利技术属性】
技术研发人员:姚文辉,陆靖,吕鹏程,常艳军,朱家稷,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。