【技术实现步骤摘要】
一种数据迁移的异常检测方法、装置、系统和存储介质
[0001]本申请涉及数据迁移技术,尤其涉及一种数据迁移的异常检测方法、装置、系统和存储介质。
技术介绍
[0002]相关技术中,将文件迁移的异常检测应用到大数据平台的过程中,由于所涉及到的数据量级可能达到太字节(Terabyte,TB)、拍字节(Petabyte,PB)等,在通过数据内容计算这些数据的信息摘要的情况下,往往需要消耗较多的计算资源,导致难以进行大批量检测。
技术实现思路
[0003]本申请实施例期望提供一种数据迁移的异常检测方法、装置、系统和存储介质。
[0004]第一方面,本申请实施例提供了一种数据迁移的检测方法,包括:
[0005]分别获取源文件和目标文件的下一层子文件的信息摘要;所述源文件表示被迁移数据的文件包;所述目标文件表示对所述源文件进行迁移后得到的文件包;所述子文件的信息摘要包括所述子文件的大小、所述子文件的存储位置和所述子文件的下一层文件的数量;
[0006]基于所述源文件的下一层子文件的信息摘要生成所述源文件的信息摘要;
[0007]基于所述目标文件的下一层子文件的信息摘要生成所述目标文件的信息摘要;
[0008]根据所述源文件的信息摘要和所述目标文件的信息摘要确定数据迁移的检测结果。
[0009]第二方面,本申请实施例提供了一种数据迁移的检测装置,包括:
[0010]获取模块,用于分别获取源文件和目标文件的下一层子文件的信息摘要;所述源文件表示被迁移数据的文件包 ...
【技术保护点】
【技术特征摘要】
1.一种数据迁移的检测方法,其特征在于,包括:分别获取源文件和目标文件的下一层子文件的信息摘要;所述源文件表示被迁移数据的文件包;所述目标文件表示对所述源文件进行迁移后得到的文件包;所述子文件的信息摘要包括所述子文件的大小、所述子文件的存储位置和所述子文件的下一层文件的数量;基于所述源文件的下一层子文件的信息摘要生成所述源文件的信息摘要;基于所述目标文件的下一层子文件的信息摘要生成所述目标文件的信息摘要;根据所述源文件的信息摘要和所述目标文件的信息摘要确定数据迁移的检测结果。2.根据权利要求1所示的方法,其特征在于,所述根据所述源文件的信息摘要和所述目标文件的信息摘要确定数据迁移的检测结果,包括:从所述源文件的信息摘要中确定待检测的异常类型对应的源文件信息和从所述目标文件的信息摘要中确定所述待检测的异常类型对应的目标文件信息;在所述源文件信息和所述目标文件信息一致的情况下,确定所述数据迁移中所述待检测的异常类型的检测结果为检测正常;在所述源文件信息和所述目标文件信息不一致的情况下,确定所述数据迁移中所述待检测的异常类型的检测结果为检测异常。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:在所述源文件信息和所述目标文件信息不一致的情况下,将所述源文件和所述目标文件均确定为数据立方体模型中的顶点文件包;对每一所述顶点文件包进行至少一次下钻分析,得到目标下钻分析结果;基于所述目标下钻分析结果,确定所述待检测的异常类型的异常子文件。4.根据权利要求1所述的方法,其特征在于,所述分别获取源文件和目标文件的下一层子文件的信息摘要,包括:基于所述源文件的下一层子文件的各磁盘扇区目录项的inode和所述目录项对应的区块信息,确定所述源文件的下一层子文件的文件属性对应的文件属性值为所述源文件的下一层子文件的信息摘要;基于所述目标文件的下一层子文件对应的各磁盘扇区目录项的inode和目录项对应的区块信息,确定所述目标文件的下一层子文件的文件属性对应的文件属性值为所述目标文件的下一层子文件的信息摘要。5.根据权利要求4所述的方法,其特征在于,所述源文件的下一层子文件的文件属性包括孙子文件的数量;则,所述基于所述源文件的下一层子文件的各磁盘扇区目录项的inode和目录项对应的区块信息,确定所述源文件的下一层子文件的文件属性对应的文件属性值为所述源文件的下一层子文件的信息摘要,包括:获取所述源文件的下一层子文件的文件目录;根据所述源文件的下一层子文件的文件目录从所述各磁盘扇区目录项的inode中,确定出所述源文件的下一层子文件的文件目录对应的区块信息;从所述源文件的下一层子文件的文件目录对应的区块信息中确定所述源文件的下一层子文件的孙子文件所包括的孙子文件名和每一所述孙子文件名对应的inode;根据每一所述孙子文件名对应的inode,确定所述孙子文件的数量为所述源文件的下一层子文件的信息摘要。
6.根据权利要求5所述的方法,其特征在于,所述源文件的下一层子文件的文件属性还包括子文件大小,所述基于...
【专利技术属性】
技术研发人员:李晶晶,李运田,史可庆,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。