数据处理方法及设备技术

技术编号:40445807 阅读:21 留言:0更新日期:2024-02-22 23:06
本公开实施例提供一种数据处理方法及设备,该方法通过在执行源集群中的元数据表搬迁至目标集群的处理中,检测到当前针对元数据表的写操作,对元数据表进行检查点操作,以备份检查点操作下元数据表中当前存量元数据信息,将当前存量元数据信息搬迁至目标集群之后,基于写操作完成之后相应的日志文件对当前存量元数据信息进行回放操作,以得到对当前存量元数据信息进行写操作之后的目标元数据信息,在元数据表搬迁完成之后,将元数据表对应的数据文件搬迁至目标集群中。该技术方案中,可以避免数据搬迁过程中出现的数据定位混乱,且不影响用户正常的读写操作。

【技术实现步骤摘要】

本公开实施例涉及计算机与网络通信,尤其涉及一种数据处理方法及设备


技术介绍

1、在大数据场景中,分布式文件系统往往是数据的存储底座。随着数据量的不断增大,单集群逐渐成为存储和访问的瓶颈,分布式问题核心之一的“分区”成为了分布式文件存储系统的痛点。业界进行数据分区的过程中,通常会影响上层业务的正常读写。

2、在现有技术中,在用户进行写操作时,提供了一种数据写入优先级,基于该数据写入优先级,写操作对应的增量数据信息优先写入至新集群,写入不成功则写入至旧集群,其他的当前存量元数据信息可以基于离线方式搬迁。

3、然而上述方式中,用户需要对增量数据的读写操作时,需要在先在新集群中尝试读写,不成功后在旧集群中再次尝试读写,一定程度上影响了用户的读写效率。


技术实现思路

1、本公开实施例提供一种数据处理方法及设备,以避免数据搬迁过程中出现的数据定位混乱,影响用户正常的读写操作的情况发生。

2、第一方面,本公开实施例提供一种数据处理方法,包括:

3、在执行源集群中的元数据表搬本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述元数据表对应的数据文件搬迁至所述目标集群中,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,在所述将所述当前存量元数据信息搬迁至所述目标集群之后,基于所述写操作完成之后相应的日志文件对所述当前存量元数据信息进行回放操作,以得到对所述当前存量元数据信息进行所述写操作之后的目标元数据信息之后,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

...

【技术特征摘要】

1.一种数据处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述元数据表对应的数据文件搬迁至所述目标集群中,包括:

3.根据权利要求1所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1-3任一项所述的方法,其特征在于,在所述将所述当前存量元数据信息搬迁至所述目标集群之后,基于所述写操作完成之后相应的日志文件对所述当前存量元数据信息进行回放操作,以得到对所述当前存量元数据信息进行所述写操作之后的目标元数据信息之后,所述方法还包括:

5.根据权利要求4所述的方法,其...

【专利技术属性】
技术研发人员:左枝凯
申请(专利权)人:北京火山引擎科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1