【技术实现步骤摘要】
【国外来华专利技术】高吞吐量流数据的同步复制
[0001]本公开涉及高吞吐量(throughput)流数据的同步复制。
技术介绍
[0002]随着云中大量数据的存储变得越来越普遍,云计算也越来越受欢迎。对数据的稳健存储的需求也已经增长,以保护存储在云中的越来越大量的数据。一些云服务提供商通过在不同地理区域的多个存储位置处异步存储数据来提高云数据存储的鲁棒性。例如,在将数据写入到第一区域中的第一或主存储位置之后,然后将数据写入到第二区域中的次存储位置。在这些不同的存储位置存储数据允许用户在其中一个存储位置无法访问的情况下恢复他们的数据。对于某些数据,例如任务关键应用,数据丢失是不可容忍的。
技术实现思路
[0003]本公开的一个方面提供了一种同步复制高吞吐量流数据的方法。该方法包括在数据处理硬件处接收数据块流,所述数据块流用于存储在分布式存储系统的第一存储位置和所述分布式存储系统的第二存储位置。所述第一存储位置与第一地理地区相关联,第二存储位置与不同于所述第一地理地区的第二地理地区相关联。方法还包括由所述数据处理硬件将所述数据块流同步写入所述第一存储位置和所述第二存储位置。在将所述数据块流同步写入到所述第一存储位置和所述第二存储位置时,方法包括由所述数据处理硬件确定在所述第二存储位置处不可恢复的故障,所述不可恢复的故障禁止将所述数据块流进一步写入到所述第二存储位置。方法还包括由所述数据处理硬件确定所述数据块流的所述写入中的故障点,所述故障点划分成功写入所述第二存储位置的数据块和未成功写入所述第二存储位置的数据块。方法还包括 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法(500),其特征在于,包括:在数据处理硬件(144)处接收数据块流(22),所述数据块流存储在分布式存储系统(140)的第一存储位置(210)和所述分布式存储系统(140)的第二存储位置(210),所述第一存储位置(210)与第一地理地区相关联,第二存储位置(210)与不同于所述第一地理地区的第二地理地区相关联;由所述数据处理硬件(144)将所述数据块流(22)同步写入所述第一存储位置(210)和所述第二存储位置(210);在将所述数据块流(22)同步写入到所述第一存储位置(210)和所述第二存储位置(210)时,由所述数据处理硬件(144)确定在所述第二存储位置(210)处不可恢复的故障,所述不可恢复的故障禁止将所述数据块流(22)进一步写入到所述第二存储位置(210);由所述数据处理硬件(144)确定所述数据块流(22)的所述写入中的故障点(220),所述故障点(220)划分成功写入所述第二存储位置(210)的数据块(22)和未成功写入所述第二存储位置(210)的数据块(22);以及由所述数据处理硬件(144)从所述故障点(220)开始,向所述分布式存储系统(140)的所述第一存储位置(210)和第三存储位置(210)同步写入所述数据块流(22),所述第三存储位置(210)与不同于所述第一地理地区和所述第二地理地区的第三地理地区相关联。2.根据权利要求1所述的方法(500),其特征在于,还包括由所述数据处理硬件(144)从所述数据块流(22)的开始点向所述故障点(220)异步写入所述数据块流(22)到所述第三存储位置(210)。3.根据权利要求1或2所述的方法(500),其特征在于,确定在所述第二存储位置(210)处所述不可恢复的故障,所述不可恢复的故障禁止将所述数据块流(22)进一步写入到所述第二存储位置(210)包括:确定将所述数据块流(22)写入所述第二存储位置(210)失败;响应于确定将所述数据块流(22)写入所述第二存储位置(210)失败,重试将所述数据块流(22)写入所述第二存储位置(210);以及当重试将所述数据块流(22)写入所述第二存储位置(210)失败时,确定所述失败是不可恢复的失败。4.根据权利要求1
‑
3中任一项所述的方法(500),其特征在于,确定所述数据块流(22)的所述写入中的故障点(220)包括:确定第一复制日志(310)是否可用,所述第一复制日志(310)可用于指示所述数据块(22)已被成功提交到所述第一存储位置(210);确定第二复制日志(310)是否可用,所述第二复制日志(310)可用于指示所述数据块(22)已被成功提交到所述第二存储位置(210);以及当所述第一复制日志(310)和所述第二复制日志(310)可用时,基于所述第一复制日志(310)的长度和所述第二复制日志(310)的长度,调和所述第一复制日志(310)和所述第二复制日志(310)。5.根据权利要求4所述的方法(500),其特征在于,调和所述第一复制日志(310)和所述第二复制日志(310)包括:确定与所述不可恢复的故障相关联的所述第二复制日志(310)的索引;
将所述第二复制日志(310)的所述索引存储在与所述数据处理硬件(144)通信的存储器硬件(146)上;完成所述第二复制日志(310)以禁止对所述第二存储位置(210)的进一步写入;以及生成提示文件(340)以指示需要调和。6.根据权利要求4或5所述的方法(500),其特征在于,还包括:当所述第一复制日志(310)可用并且所述第二复制日志(310)不可用时,由所述数据处理硬件(144)基于所述第一复制日志(310)的长度,调和所述第一复制日志(310)和所述第二复制日志(310)。7.根据权利要求4
‑
6中任一项所述的方法(500),其特征在于,还包括:当所述第一复制日志(310)不可用并且所述第二复制日志(310)可用时,由所述数据处理硬件(144)基于所述第二复制日志(310)的长度,调和所述第一复制日志(310)和所述第二复制日志(310)。8.根据权利要求1
‑
7中任一项所述的方法(500),其特征在于,还包括:由所述数据处理硬件(144)生成包括时间戳(412)的第一复制日志(310),所述时间戳(412)指示何时将每个数据块(22)写入所述第一存储位置(210);以及由所述数据处理硬件(144)生成包括时间戳(412)的第二复制日志(310),所述时间戳(412)指示何时将每个数据块(22)写入所述第二存储位置(210)。9.根据权利要求8所述的方法(500),其特征在于,还包括:在所述数据处理硬件(144)处接收查询请求(410),请求返回存储在所述第一存储位置(210)的多个数据块(22);由所述数据处理硬件(144)基于所述第一复制日志(310)的长度和所述第二复制日志(310)的长度调和所述第一复制日志(310)和所述第二复制日志(310);以及由所述数据处理硬件(144)基于所述第一复制日志(310)和所述第二复制日志(310)的所述调和返回所请求的所述多个数据块(22)。10.根据权利要求9所述的方法(500),其特征在于,调和所述第一复制日志(310)和所述第二复制日志(310)包括:确定所述第二复制日志(310)的长度不可用;以及在阈值时间段内确定将后续写入添加到...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。