【技术实现步骤摘要】
基于深度扫描的文件处理方法、系统、装置及存储介质
[0001]本专利技术涉及文件扫描
,具体而言,涉及一种基于深度扫描的文件处理方法、系统、装置及存储介质。
技术介绍
[0002]在许多文件系统中都会用到文件扫描技术,有的时候文件目录需要多次扫描,如果文件数量非常多,扫描过程中因某种因素忽然中断,不得不从头再次扫描,导致文件扫描十分耗时。
[0003]现有技术中,市面上实现类似文件扫描功能的服务大多基于整体文件扫描,未发现中断后继续扫描,或避免重复扫描的技术;在高并发环境下,严重影响系统的整体吞吐量,且在系统内存不足时,容易引起程序内存溢出,造成进程崩溃,影响系统的高可用性。
[0004]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0005]本专利技术实施例提供了一种基于深度扫描的文件处理方法、系统、装置及存储介质,以至少解决现有技术中由于文件扫描系统重复扫描,导致浪费扫描时间、消耗计算机资源的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种基 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度扫描的文件处理系统,其特征在于,包括:控制台,用于生成敏感策略信息和扫描任务,其中,每一个扫描任务对应一个任务标记,所述策略信息用于判断目标文件是否包含敏感信息的规则和后续动作;文件扫描系统,与所述控制台连接,用于根据所述控制台下发所述扫描任务对目标文件目录执行深度扫描处理,得到待解析文件队列,其中,所述目标文件目录为文件服务器指定的文件目录;文件解析系统,与所述文件扫描系统和所述控制台连接,用于对所述文件扫描系统发送的待解析文件队列执行文件解析,得到文件解析信息,并检测所述文件解析信息是否命中所述控制台下发的所述敏感策略信息,将命中结果上报至所述控制台。2.根据权利要求1所述的系统,其特征在于,所述文件扫描系统还用于在对所述目标文件目录进行深度扫描处理的过程中,对扫描到的文件进行标记和存储,若检测到所述目标文件目录已扫描过,则判断所述目标文件目录中的所有文件是否被更新;若未被更新则无需继续扫描处理,并输出与所述目标文件目录对应的历史扫描结果。3.根据权利要求1所述的系统,其特征在于,所述文件扫描系统还用于在对所述目标文件目录进行深度扫描处理的过程中,若检测到所述目标文件目录已扫描过但是存在中断标记,则对所述目标文件目录中所述中断标记之后的未扫描文件直接启动重新扫描处理。4.根据权利要求3所述的系统,其特征在于,所述文件扫描系统还用于在对所述目标文件目录进行深度扫描处理的过程中,若检测到所述目标文件目录已扫描过但是存在中断标记,则判断所述中断标记之前的已扫描文件是否被更新;若判断结果为所述已扫描文件未被更新,则无需继续扫描所述已扫描文件;若判断结果为所述已扫描文件已被更新,则对所述目标文件目录中所述已扫描文件启动重新扫描处理。5.根据权利要求1所述的系统,其特征在于,所述基于深度扫描的文件处理系统还包括:配置中心,与所述控制台和所述文件扫描系统、所述文件解析系统连接,用于接收所述控制台下发的所述敏感策略信息和所述扫描任务,并将所述扫描任务转发至所述文件扫描系...
【专利技术属性】
技术研发人员:卞海文,赵晶,王志海,喻波,韩振国,
申请(专利权)人:北京明朝万达科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。