一种多数据中心环境下的数据分布策略及数据修复算法制造技术

技术编号：29594338 阅读：25 留言：0更新日期：2021-08-06 19:56

本发明专利技术公开了一种跨数据中心的数据分布策略，这种数据分布策略通过对数据在多个数据中心之间的分布作出约束，将一组纠删码分别存储在多个数据中心，其中每个云中心内部所存储的码块都小于恢复要求。使用这种数据分布策略部署的存储系统，可以允许数据中心级别的事故，从而保证了数据的高可靠性。并针对使用这种分布策略分布的MSR码单节点失效场景，通过在修复过程中引入辅助计算节点和节点计算能力，设计出了相应的遗传算法以最小修复时延和最小额外传输开销为目标对节点修复树进行优化求解，最终实现修复时延和额外传输开销的trade_off。

全部详细技术资料下载

【技术实现步骤摘要】
一种多数据中心环境下的数据分布策略及数据修复算法
本专利技术属于分布式纠删码存储系统领域，具体涉及一种多数据中心环境下的数据分布策略及数据修复算法。
技术介绍
分布式存储系统凭借其优秀的性能和低廉的构造成本成为了当前大规模数据存储领域的主流存储系统。但由于分布式存储系统的底层设备普遍采用廉价商用硬件，故障率较高，因此，如何在节点失效成为一种常见问题的场景下保证存储数据的完整性与可靠性成为了首要问题。当单个数据中心遭遇爆炸、地震或断电等不可预知事件时，整个数据中心都会被迫停止服务，造成巨大损失，如2020年7月24日，腾讯云因广州运营商光缆物理中断宕机，导致腾讯云广州区域全面断网，包括腾讯云主页、控制台、DNSPod等业务都受到了波及，由此可见跨地域数据中心的必要性，这种跨地域数据中心将数据分别存储在多个数据中心内，以存储空间为代价，进一步提高了数据的可靠性，通过将请求发送至不同的数据存储节点，更好的实现负载均衡及更快的响应用户请求。当数据中心级别的故障发生时，跨地域数据中心可以不被单个数据中心的故障影响到整体存储系统提供数据访问服务，能更有效的应对这类灾难性事故。最为重要的是，因为这种多中心可以允许数据中心级别的事故，所以数据中心可以省去大量的发电机、UPS等设备，有效降低成本。
技术实现思路
为了克服上述现有技术的不足，本专利技术提供了一种多数据中心环境下的数据分布策略及数据修复算法，数据分布策略有效容许了数据中心级别的灾难，数据修复算法为灾后数据再分布做出了进一步保证，二者相结合有效保...

【技术保护点】
1.一种多数据中心环境下的数据分布策略及数据修复算法，其特征在于：/n(1)提出了一种在多数据中心背景下的纠删码分布策略。这种数据分布策略利用纠删码恢复原文件时对码块的数量要求这一条件，将一组纠删码分别存储在多个数据中心，其中每个云中心内部所存储的码块都小于恢复要求。使用这种数据分布策略部署的数据，当存储系统中有节点受到攻击时，由于单个云中心内部所存储的数据有限，无法得到完整的元数据；同时，当某个数据中心遭受自然灾害等故障导致节点失效时，也可以通过其余数据中心中存储的数据来重构失效节点，从而保证了数据的高可靠性。这种分布策略可以表示为式(1),其中Ci表示为每个数据中心所存储的数据块的数量，k为重构元数据所需的最小节点数，M为原数据的大小：/n

【技术特征摘要】
1.一种多数据中心环境下的数据分布策略及数据修复算法，其特征在于：
(1)提出了一种在多数据中心背景下的纠删码分布策略。这种数据分布策略利用纠删码恢复原文件时对码块的数量要求这一条件，将一组纠删码分别存储在多个数据中心，其中每个云中心内部所存储的码块都小于恢复要求。使用这种数据分布策略部署的数据，当存储系统中有节点受到攻击时，由于单个云中心内部所存储的数据有限，无法得到完整的元数据；同时，当某个数据中心遭受自然灾害等故障导致节点失效时，也可以通过其余数据中心中存储的数据来重构失效节点，从而保证了数据的高可靠性。这种分布策略可以表示为式(1),其中Ci表示...

【专利技术属性】
技术研发人员：王勇，锁欣，叶苗，蔡月，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：广西;45

全部详细技术资料下载我是这个专利的主人