【技术实现步骤摘要】
本专利技术涉及纠删码技术,尤其涉及针对hadoop集群数据快速恢复方法。
技术介绍
1、hadoop作为一种分布式系统架构已被广泛应用于大规模数据存储和处理。hadoop分布式文件系统(hdfs)通过数据冗余机制确保数据的高可靠性,当数据节点发生故障时,系统会自动将丢失的数据块复制到其他健康节点上,以维持预设的副本数量,保障数据的可用性和可靠性。
2、当前hadoop集群的数据恢复机制存在明显的不足。现有的恢复策略对所有数据块采用相同的副本数量,没有考虑不同数据块的重要性差异,导致对高价值数据的保护不足,或对低价值数据的资源浪费。重要业务数据和非关键数据获得相同级别的保护,无法实现资源的高效利用。
3、现有的目标节点选择机制较为简单,主要基于机架感知策略,未充分考虑网络拓扑结构和链路负载情况。现有的技术未能有效预测数据节点的可靠性,缺乏对节点历史运行状态的深入分析。在选择目标节点时,无法识别那些潜在的不稳定节点,导致恢复后的数据可能再次面临丢失风险,增加了系统的维护成本和数据管理复杂度。
<
...【技术保护点】
1.针对hadoop集群数据快速恢复方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于所述待恢复数据块标识信息获取待恢复数据块的访问频率因子、关联度因子以及业务价值因子,加权求和得到所述待恢复数据块的重要性得分的步骤包括:
3.根据权利要求1所述的方法,其特征在于,根据所述重要性得分,通过预设的非线性副本数调整函数计算所述待恢复数据块的目标副本数的步骤包括:
4.根据权利要求1所述的方法,其特征在于,基于集群网络拓扑信息计算网络链路的负载权重,基于所述负载权重确定所述目标副本数对应的候选目标数据节点的步骤包括:
5.根...
【技术特征摘要】
1.针对hadoop集群数据快速恢复方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,基于所述待恢复数据块标识信息获取待恢复数据块的访问频率因子、关联度因子以及业务价值因子,加权求和得到所述待恢复数据块的重要性得分的步骤包括:
3.根据权利要求1所述的方法,其特征在于,根据所述重要性得分,通过预设的非线性副本数调整函数计算所述待恢复数据块的目标副本数的步骤包括:
4.根据权利要求1所述的方法,其特征在于,基于集群网络拓扑信息计算网络链路的负载权重,基于所述负载权重确定所述目标副本数对应的候选目标数据节点的步骤包括:
5.根据权利要求1所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:高海玲,吕彦奎,
申请(专利权)人:北京科杰科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。