【技术实现步骤摘要】
【国外来华专利技术】用于迁移活动文件系统的方法、设备和系统
技术介绍
[0001]如今,所谓的大数据在云中找到了天然的归宿。在云中,领先的公司正在充分利用廉价、可扩展的存储以及强大的云分析平台带来的灵活性。然而,尽管将大数据迁移到云有令人信服的优势,但也存在潜在的业务风险。
[0002]将大数据迁移至云的一种方法是手动完成。手动迁移是拷贝大数据的一种定制的战术方法。当管理员手动迁移数据时,他们会创建、管理、安排和维护自定义或开源脚本来迁移大型数据集。当数据传输设备添加到大数据到云的迁移计划中时,需要额外的自定义脚本来上传数据。这种手动大数据云迁移方法的业务风险包括数据不一致、业务中断和高IT资源要求。数据不一致的风险
[0003]大型数据集迁移至云需要时间。以每秒1千兆位(Gbps)的速度迁移1拍字节(PB)的数据大约需要100天。即使有数据传输设备,供应商的加载时间也需要数周。虽然使数据在云中可用,但仍然需要更改和接收。在漫长的迁移时间内更改数据会增加将大规模数据集准确引入云的风险。然而,由于手动迁移依赖于侧重于复制数据的自定义或开源脚本,迁移团队可能无法验证迁移的准确性。事实上,大规模手动对账并不能保证数据结果完全一致。此外,这种方法不支持迁移过程中可能发生的新更新。通常,大规模数据迁移的手动方法不支持迁移期间修改或创建的数据更改。业务中断的风险
[0004]由于规模和适用性优势,组织已将越来越多的任务关键型工作负载部署到Hadoop。企业关键型工作负载带来了对可用性、一致性、安全性和可审核性的期望。就复杂性而言,移动不变的数据集很简 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种在处理对元数据进行操作的命令的同时,将元数据从具有有根树结构的提供者文件系统D迁移到受让者文件系统B的计算机实现的方法,包括:当没有接收到对元数据进行操作的命令时,通过将提供者文件系统D的节点的元数据顺序复制到受让者文件系统B,在受让者文件系统B处复制提供者文件系统D的有根树结构;和接收对元数据进行操作的命令;当所接收的命令的所有参数都存在于提供者文件系统D和受让者文件系统B中时,在提供者文件系统D和受让者文件系统B中执行所接收的命令;仅当所接收的命令的参数都不存在于受让者文件系统B中时,在提供者文件系统D处执行所接收的命令;当所接收的命令中只有一些参数存在于受让者文件系统B中时,将所接收的命令排入队列,至少直到所接收的命令的所有参数都存在于受让者文件系统B中;和当其所有参数都存在于受让者文件系统B中时,将接收到的命令出队并调度执行。2.根据权利要求1所述的计算机实现的方法,进一步将任何剩余的命令从队列中出列,并且当提供者文件系统D的有根树结构已经被复制到受让者文件系统B时,调度出列的命令用于执行。3.根据权利要求1所述的计算机实现的方法,其中,所述队列是最小堆。4.根据权利要求1所述的计算机实现的方法,其中复制提供者文件系统D的有根树结构包括以深度优先扫描(DFS)方式遍历和复制有根树结构。5.根据权利要求1所述的计算机实现的方法,其中,当对元数据进行操作的命令包括对作为有根树结构的复制的前缘的原型的节点的删除操作时,所述计算机实现的方法还包括将待删除的节点之后的下一个节点识别为顺序复制要恢复的节点,在提供者文件系统D和受让者文件系统B上执行删除操作,并在所识别的下一个节点恢复顺序复制。6.根据权利要求1所述的计算机实现的方法,其中,当对元数据进行操作的命令包括已经从提供者文件系统D复制到受让者文件系统B的元数据的重命名操作时,所述计算机实现的方法还包括执行重命名操作,就好像其是尚未从提供者文件系统D复制到受让者文件系统B的元数据的重命名操作一样。7.根据权利要求1所述的计算机实现的方法,其中,当对元数据进行操作的命令包括尚未从提供者文件系统D复制到受让者文件系统B的元数据的重命名操作时,所述计算机实现的方法还包括在提供者文件系统D执行重命名操作,并在受让者文件系统B删除受重命名操作影响的任何节点。8.根据权利要求1所述的计算机实现的方法,还包括将与元数据相关联的数据块从提供者文件系统D独立复制到受让者文件系统B。9.根据权利要求1所述的计算机实现的方法,进一步包括:使用扫描器进程以逐步方式遍历有根树结构,所述扫描器进程获取提供者文件系统D的未迁移部分的下一节点的元数据,并将所获取的元数据提供给受让者文件系统B处的远程代理,所述远程代理配置为将所提供的元数据复制到受让者文件系统B。10.根据权利要求9所述的计算机实现的方法,还包括如果获取提供者文件系统D的未迁移部分的下一个节点的元数据会超过有根树结构的节点集合S的最小元素,则阻止扫描
器获取所述元数据,所述节点集合S是已经允许执行的命令的参数,在提供者文件系统D的未迁移部分上操作,并且不知道已经终止。11.根据权利要求1所述的计算机实现的方法,其中接收对所述元数据进行操作的命令包括在所述命令被执行和操作以改变存储在所述提供者文件系统D中的元数据之前,拦截来自其发送者的所述命令。12.根据权利要求1所述的计算机实现的方法,还包括在提供者文件系统D的有根树结构已经迁移到受让者文件系统B之后,将存在于队列中的任何剩余命令出队并调度以执行。13.根据权利要求1所述的计算机实现的方法,其中将元数据从提供者文件系统D迁移到受让者文件系统B,同时处理在提供者文件系统D的有根树结构的一次遍历中执行的对元数据进行操作的命令。14.根据权利要求1所述的计算机实现的方法,其中将接收到的命令入队包括暂时阻止其执行。15.根据权利要求1所述的计算机实现的方法,其特征在于,还包括接收重复的重命名命令,并通过将所述重复的重命名命令压入大小有限的堆栈以供以后执行来暂时阻止所述重复的重命名命令的执行。16.根据权利要求1所述的计算机实现的方法,其中,当将提供者文件系统D的节点的元数据复制到受让者文件系统B遇到打开文件时,所述方法还包括临时阻止从打开文件向下跨越到有根树结构的分层较低部分的有根树结构的一部分。17.根据权利要求1所述的计算机实现的方法,其中所述顺序复制包括复制滑动窗口的元数据,所述滑动窗口包含至少一个节点,并且由前缘节点和后缘节点界定,所述前缘节点是其元数据被提取用于复制的最后节点,所述后缘节点是已经发出元数据请求并且受让者文件系统B还没有确认其成功写入的最小节点。18.根据权利要求1所述的计算机实现的方法,还包括:当从受让者文件系统B接收到成功写入的确认时,并且当其元数据被获取的提供者文件系统D的最后一个节点被更新时,移动滑动窗口以从提供者文件系统D获取附加元数据。19.根据权利要求1所述的计算机实现的方法,其中滑动窗口内的提供者文件系统D的节点数量随着对元数据的请求被发布到提供者文件系统D而增长,并且随着从受让者文件系统B接收到元数据成功写入的确认而缩减。20.根据权利要求1所述的计算机实现的方法,还包括不允许作为所述有根树结构的最后一个节点的前缘节点,所述有根树结构的元数据是从超越所述有根树结构的节点集合S的最小元素中提取的,所述节点集合S是已经被允许执行的命令的参数,在所述提供者文件系统D的未迁移部分上操作,并且不知道已经终止。21.一种计算机实现的系统,包括:...
【专利技术属性】
技术研发人员:Y,
申请(专利权)人:万迪斯科股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。