The invention discloses a method for scanning the file and scanned documents, including the method of the document scanning control module according to the strategy execution time to scan module scan instruction; the scanning module according to the scanning scanning task instruction generation and corresponding strategy; operation control thread to scan tasks to multiple thread allocation; multi operation a thread that multiple threads are to scan in a depth first way to get directory scanning scanning task results; and return the results to the scanning task control module. The present invention is scanned by running multiple threads to make multiple thread to scan in a depth first way to get the directory scanning task results can improve the accuracy of file transmission remote replication process.
【技术实现步骤摘要】
本专利技术涉及计算机
,具体来说,涉及一种扫描文件的方法及扫描文件的系统。
技术介绍
远程复制系统是提供将一个源端文件系统中的需要备份的备份数据复制到另一个目标端文件系统中,并对该备份数据进行管理。因此在远程复制系统中就需要一个文件扫描模块来提供扫描文件的功能,以便远程复制系统确定哪些文件需要备份。现有的扫描文件功能并不能很好地满足远程复制系统的要求,无法实现将源端文件系统中的文件正确高效地传输到目标端文件系统中。同时在扫描文件过程中还存在大量的冗余扫描操作,导致扫描效率较低。针对相关技术不能正确高效地传输文件、及扫描效率较低的问题,目前尚未提出有效的解决方案。
技术实现思路
针对相关技术中不能正确高效地传输文件、及扫描效率较低的问题,本专利技术提出一种扫描文件的方法及扫描文件的系统,能够提高远程复制过程中传输文件的准确性。本专利技术的技术方案是这样实现的:根据本专利技术的一个方面,提供了一种扫描文件的方法,包括:控制模块根据策略的执行时间向扫描模块发送扫描指令;扫描模块根据扫描指令生成与策略对应的扫描任务;运行控制线程以分配扫描任务至多个工作线程;运行多个工作线程使多个工作线程均以深度优先方式对待扫描的目录进行扫描以得到扫描任务的结果;以及向控制模块返回扫描任务的结果。在一个实施例中,工作线程在同一时刻只执行一个扫描任务。在一个实施例中,以深度优先方式对待扫描的目录进行扫描,包括:对对待扫描的目录进行扫描并获取目录项;当目录项为目录时,继续对目录项对应的目录进行扫描;以及当目录项为文件时,由发送线程将文件对应的文件信息发送至控制模块;其中,扫描任务的 ...
【技术保护点】
一种扫描文件的方法,其特征在于,包括:控制模块根据策略的执行时间向扫描模块发送扫描指令;扫描模块根据所述扫描指令生成与所述策略对应的扫描任务;运行控制线程以分配所述扫描任务至多个工作线程;运行所述多个工作线程使所述多个工作线程均以深度优先方式对待扫描的目录进行扫描以得到扫描任务的结果;以及向所述控制模块返回所述扫描任务的结果。
【技术特征摘要】
1.一种扫描文件的方法,其特征在于,包括:控制模块根据策略的执行时间向扫描模块发送扫描指令;扫描模块根据所述扫描指令生成与所述策略对应的扫描任务;运行控制线程以分配所述扫描任务至多个工作线程;运行所述多个工作线程使所述多个工作线程均以深度优先方式对待扫描的目录进行扫描以得到扫描任务的结果;以及向所述控制模块返回所述扫描任务的结果。2.根据权利要求1所述的扫描文件的方法,其特征在于,所述工作线程在同一时刻只执行一个扫描任务。3.根据权利要求1所述的扫描文件的方法,其特征在于,以深度优先方式对待扫描的目录进行扫描,包括:对所述对待扫描的目录进行扫描并获取目录项;当所述目录项为目录时,继续对所述目录项对应的所述目录进行扫描;以及当所述目录项为文件时,由发送线程将所述文件对应的文件信息发送至所述控制模块;其中,所述扫描任务的结果包括所述文件信息。4.根据权利要求1所述的扫描文件的方法,其特征在于,还包括:获取同一策略对应的任意两次相邻的扫描任务中发生改变的文件;以及将所述发生改变的文件发送至控制模块以得到所述任意两次相邻的扫描任务中第二次扫描任务的结果。5.根据权利要求4所述的扫描文件的方法,其特征在于,获取同一策略对应的任意两次相邻的扫描任务中发生改变的文件,包括:获取并存储任意两次相邻的扫描任务中第一次扫描任务的开始时间;在所述两次相邻的扫描任务之间有文件被修改...
【专利技术属性】
技术研发人员:龚超,李国君,张新凤,王慧,王灯殿,石静,张记华,宋频轶,
申请(专利权)人:曙光信息产业北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。