【技术实现步骤摘要】
一种数据处理方法、装置及计算设备
本专利技术涉及分布式存储
,特别涉及一种数据处理方法、装置及计算设备。
技术介绍
随着互联网应用的不断增长,通过互联网访问的数据量也在不断增长。随着被访问数据量的增长,数据存储系统已被修改以容纳更大的数据集并提供快速稳定的数据访问。用于容纳更大的数据集并提供快速稳定的数据访问的一种类型的数据存储系统是分布式文件系统。分布式文件系统通常包括数据节点和元数据节点。数据节点负责存储数据,元数据节点负责处理与元数据相关的请求和权限管理。其中,元数据又称中介数据、中继数据,为描述数据的数据,主要是描述数据属性的信息,例如目录结构等。在现有的分布式文件系统中,其目录结构中的文件和目录缺少唯一标识,导致用户无法判断具有同一名称的文件是否内容一致。例如,如果某文件被删除之后再次创建了与该文件同名的文件,用户无法获知所创建的文件是否与以前的文件内容一致。因此,需要提供一种数据处理方案,使得可以将现有的目录结构转换为其目录节点具有唯一标识的目录结构。
技术实现思路
为此,本专利技术实施例提供了一种数据处理方法、装置及计算设备,以力图解决或者至少缓解上面存在的至少一个问题。根据本专利技术实施例的一个方面,提供了一种数据处理方法,应用于分布式文件系统,该方法包括:为分布式文件系统的主节点所存储的第一目录结构的第一目录节点生成标识信息,该标识信息用于在第一目录结构中唯一标识第一目录节点对应的目录或者文件;生成指示对第一目录结构进行转换的第一操作日志,分 ...
【技术保护点】
1.一种数据处理方法,应用于分布式文件系统,所述方法包括:/n为所述分布式文件系统的主节点所存储的第一目录结构的第一目录节点生成标识信息,所述标识信息用于在所述第一目录结构中唯一标识所述第一目录节点对应的目录或者文件;/n生成指示对所述第一目录结构进行转换的第一操作日志,所述分布式文件系统的备用节点基于所述第一操作日志,为所述备用节点所存储的第二目录结构的第二目录节点生成标识信息,所述第二目录结构为所述第一目录结构的副本,所述第二目录节点的标识信息与对应第一目录节点的标识信息相同。/n
【技术特征摘要】
1.一种数据处理方法,应用于分布式文件系统,所述方法包括:
为所述分布式文件系统的主节点所存储的第一目录结构的第一目录节点生成标识信息,所述标识信息用于在所述第一目录结构中唯一标识所述第一目录节点对应的目录或者文件;
生成指示对所述第一目录结构进行转换的第一操作日志,所述分布式文件系统的备用节点基于所述第一操作日志,为所述备用节点所存储的第二目录结构的第二目录节点生成标识信息,所述第二目录结构为所述第一目录结构的副本,所述第二目录节点的标识信息与对应第一目录节点的标识信息相同。
2.如权利要求1所述的方法,其中,为目录结构的目录节点生成标识信息,包括:
采用单个线程为目录结构的目录节点生成标识信息;或者采用多个线程并行地为目录结构的目录节点生成标识信息。
3.如权利要求2所述的方法,其中,采用多个线程并行地为目录结构的目录节点生成标识信息,包括:
采用主线程遍历所述目录结构;
对于遍历到的根目录节点下的目录节点,为所述目录节点生成标识信息;
如果所述目录节点对应于目录,则判断位于对应目录下的文件数量和/或子目录数量是否超过预定阈值;
如果超过,采用新的线程遍历所述目录节点下的目录节点,并在新的线程中重复上述为目录节点生成标识信息和判断位于对应目录下的文件数量和/或子目录数量是否超过预定数值的步骤,所述新的线程以所述目录节点的标识信息为起始标识信息。
4.如权利要求3所述的方法,其中,采用多个线程并行地为目录结构的目录节点生成标识信息,还包括:
如果不超过,继续采用当前线程遍历所述目录节点下的目录节点,并重复上述为目录节点生成标识信息和判断位于对应目录下的文件数量和/或子目录数量是否超过预定数值的步骤。
5.如权利要求3或4所述的方法,其中,对于各线程,为该线程遍历到的目录节点生成标识信息,包括:
至少基于所述线程所遍历的上一个目录节点的标识信息,生成所述线程遍历到的目录节点的标识信息。
6.如权利要求5所述的方法,其中,至少基于所述线程所遍历的上一个目录节点的标识信息,生成所述线程遍历到的目录节点的标识信息,包括:
如果未采用新的线程来遍历所述上一个目录节点下的目录节点,则根据所述上一个目录节点的标识信息生成所述线程遍历到的目录节点的标识信息;
如果采用新的线程来遍历所述上一个目录节点下的目录节点,则根据所述上一个目录节点的标识信息、以及位于所述上一个目录节点对应目录下的文件数量和/或子目录数量,生成所述线程遍历到的目录节点的标识信息。
7.如权利要求5所述的方法,其中,对于各线程,为该线程遍历到的目录节点生成标识信息,包括:
如果所述目录节点为所述线程所遍历的首个目录节点,则根据所述线程的起始标识信息来生成所述目录节点的标识信息。
8.如权利要求1...
【专利技术属性】
技术研发人员:刘俊峰,吕鹏程,常艳军,段培乐,姚文辉,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。