一种动态调整电子文件遍历频率的方法技术

技术编号:12091427 阅读:88 留言:0更新日期:2015-09-23 09:45
本发明专利技术提供一种动态调整电子文件遍历频率的方法,包括:A、确定文件夹列表,以及各文件夹中电子文件的数量;B、针对各文件夹内电子文件的数量,生成对于该文件夹的当前遍历频率;C、依据当前遍历结果判断各文件夹内电子文件数量的变化量,并针对所述变化量的多少,对应调整各电子文件夹下次遍历频率的高低。由上,通过文件夹数量变化动态调整遍历频率,文件数量越多时,遍历频率越快。

【技术实现步骤摘要】
一种动态调整电子文件遍历频率的方法
本专利技术涉及信息安全
,特别涉及一种动态调整电子文件遍历频率的方法。
技术介绍
现有技术通过对文件结构解析来提高遍历电子文件或电子数据的效率。现有技术的解析是对数据包本身的优化,包括xml格式、包内格式等,减少了冗余代码出现的几率,加快了遍历速率,但是文件数量很大或文件夹层级较多时遍历文件效率不显著,系统资源利用率低。
技术实现思路
有鉴于此,本专利技术的主要目的在于,提供一种动态调整电子文件遍历频率的方法,包括:A、确定文件夹列表,以及各文件夹中电子文件的数量;B、针对各文件夹内电子文件的数量,生成对于该文件夹的当前遍历频率;C、依据当前遍历结果监控各文件夹内的电子文件量的变化,并针对所述变化的多少,对应调整各文件夹下次遍历频率的高低。由上,通过文件夹数量变化动态调整遍历频率,文件数量越多时,遍历频率越快。可选的,步骤A包括:获取所有电子文件所在的各级文件夹的目录;依据所述目录将各级文件夹展开,形成图状遍历结构,获取文件夹数量;针对每个文件夹,对应生成一单独的单个文件夹遍历线程,通过遍历获取对应各文件夹内电子文件的数量。由上,相比于传统树形结构的递归式查询方式,由一顶点出发到该顶点所在队伍的队尾,再返回该顶点访问其他队伍,图状遍历结构可从图中任一点出发对对象进行有且仅有一次的访问,提高了访问效率。可选的,步骤A包括:获取所有电子文件所在的各级文件夹的目录;依据所述目录将各级文件夹展开,形成图状遍历结构;生成随机遍历线程,并针对图状遍历结构分配所述遍历线程;每条遍历线程获取其负责的文件夹数量,针对每个文件夹,对应生成一单独的单文件夹遍历线程,通过遍历获取对应各文件夹内的电子文件数量。由上,采用多遍历线程并行方式获取初始状态下电子文件的数量,单一遍历线程,更进一步的提高了初始遍历的效率。可选的,所述步骤B中当前遍历频率与该文件夹内的电子文件数量呈正比。由上,针对每个文件夹内的初始电子文件数量,为其分配遍历频率,相比于所有文件夹采用相同遍历频率,可以节省遍历资源。可选的,步骤C中,所述针对所述变化的多少,对应调整各电子文件夹下次遍历频率的高低包括:计算电子文件的增量超过预设增量为X%时,则下次遍历频率提高为当前遍历频率的1+X%;计算电子文件的减量超过预设减量为X%时,则下次遍历频率降低为当前遍历频率的1-X%。由上,当文件夹内的电子文件多,则遍历频率高,感知文件夹内文件变化的效率就越高;文件夹内的电子文件少,则遍历频率低,感知文件夹内文件变化的效率越低。可选的,所述动态调整电子文件遍历频率还包括:以调整后的遍历频率替换当前遍历频率。由上,以每一次调整后的频率作为下一次调整的基础,通过根据文件夹数量动态改变线程数量,用文件夹中文件的数量来动态改变处理频率,巧妙的实现了文件越多,处理的频率越高,使用效率就越高。附图说明图1所示为本专利技术的原理示意图;图2所示为图状遍历结构的原理示意图。具体实施方式为克服现有技术存在的缺陷,本专利技术提供一种动态调整电子文件遍历频率的方法,通过文件夹数量动态调整遍历频率,文件数量越多时,遍历频率越高。如图1所示,本专利技术包括以下步骤:S10:依据电子文件所存储的文件夹目录,形成图状遍历结构。获取数据库中所有电子文件所存储的文件夹目录,依据其存储目录将各级文件夹展开,形成图状遍历结构。如图2所示,图状遍历结构是指从图中的任一顶点出发,对图中的所有顶点访问且只访问一次的结构。假设图2中顶点V1~V8表示8个不同文件夹,初始状态下,图中所有文件夹未被访问,则图状遍历是从图中某个文件夹(例如V1)出发,访问此文件夹,然后依次从此文件夹(V1)起,访问其他未被访问的相邻文件夹,直至图中所有和文件夹V1有路径相通的其他文件夹都被访问到。若此时图中尚有文件夹未被访问,则另选图中一个未被访问的文件夹作起始点,重复上述过程,直至图中所有文件夹都被访问到为止。相比于传统树形结构的递归式查询方式,由一顶点出发到该顶点所在队伍的队尾,再返回该顶点访问其他队伍,图状遍历结构可从图中任一点出发对各顶点进行有且仅有一次的访问,提高了访问效率。S20:生成随机数量的遍历线程,并针对图状遍历结构分配所述各遍历线程。生成一遍历线程的随机数,基于图状遍历结构中呈现的文件夹数量,采用平均分配原则分配给每条遍历线程相同的业务量。相比于单条遍历线程,多条遍历线程并行,显然可以进一步提高对于图状遍历结构的遍历效率。S30:每条遍历线程获取其负责的文件夹数量,针对每个文件夹,对应生成一单独的单个文件夹遍历线程。S40:针对各文件夹内的电子文件量,生成文件夹初始遍历频率。每条单个文件夹遍历线程通过遍历,获取其所负责的文件夹内电子文件的数量,为该文件设定初始遍历频率,所述初始遍历频率与该文件夹内的文件数量成正比,即文件夹内的电子文件数量多,则初始遍历频率高,电子文件数量少,则初始遍历频率低。S50:监控各文件夹内的文件量变化,依据变化对应动态调整各文件夹的遍历频率。每条单文件夹遍历线程针对其所负责的文件夹进行监控。例如对该文件夹的初始遍历频率为每间隔10小时进行一次,在遍历过程中,如果发现在该时间内增加的电子文件数量大于预设增量,则提高遍历频率。具体的,电子文件的增加量大于预设增量的X%时,则遍历频率提高为初始遍历频率的1+X%。同时,将提高后的遍历频率替换初始遍历频率。这表示系统预测将会由更多的文件进入系统,需要为其准备更多资源。当下次遍历后需要再次调整遍历频率时,以下次调整后的频率代替当前次遍历频率,以此类推。同理,如果发现在该时间范围内该文件夹内的电子文件数量减少,且减少量大于预设的减少量时,则降低遍历频率。具体算法与上述相同,即电子文件的减少量大于预设减少量的X%时,则下次遍历的频率降低为初始遍历频率的1-X%。这表示系统预测将会由更少的文件进入系统,不需要为其准备更多资源。总结来说,当文件夹内的电子文件多,则遍历频率高,感知文件夹内文件变化的效率就越高;文件夹内的电子文件少,则遍历频率低,感知文件夹内文件变化的效率越低。本专利技术动态调整电子文件遍历频率的方法可应用于全文检索引擎技术。举例来说,现有的全文检索引擎,每天在固定时间进行全文遍历,当电子文件的数量很大或者文件夹层级很多时,如果针对所有文件夹同时遍历,显然遍历过程的效率很低。采用本申请技术方案,如果在一次遍历过程中发现某文件夹中的电子文件增加(或减少)的数量超过预期,则对应改变对该文件夹的遍历频率。针对增加数量多的提高遍历频率,从而可以更高效的获得该文件夹内电子文件的信息。用文件夹中电子文件的数量来动态改变遍历频率,巧妙的实现了电子文件越多,处理的频率越高,使用效率就越高。另外,本专利技术动态调整电子文件遍历频率的方法还适用于对电子文件打标记处理。现有情况下,采用在电子文件进行存储时候打标记,或者针对文件夹中已有的电子文件进行轮询打标记,如此一来,当电子文件数量众多时,打标记的效率很低。采用本专利技术技术方案,仅在文件夹内的电子文件发生变化时,在电子文件中打标记,针对未变化的则不进行处理。由此可以提高对电子文件的处理效率,并且针对所有发生变化的电子文件均进行记录。同时,针对电子文件数量变化较大的文件夹,灵活调整其遍历频率(打标记频率本文档来自技高网...
一种动态调整电子文件遍历频率的方法

【技术保护点】
一种动态调整电子文件遍历频率的方法,其特征在于,包括:A、确定文件夹列表,以及各文件夹中电子文件的数量;B、针对各文件夹内电子文件的数量,生成对于该文件夹的当前遍历频率;C、依据当前遍历结果判断各文件夹内电子文件数量的变化量,并针对所述变化量的多少,对应调整各电子文件夹下次遍历频率的高低。

【技术特征摘要】
1.一种动态调整电子文件遍历频率的方法,其特征在于,包括:A、确定文件夹列表,以及各文件夹中电子文件的数量;B、针对各文件夹内电子文件的数量,生成对于该文件夹的当前遍历频率;C、依据当前遍历结果监控各文件夹内的电子文件量的变化,并针对所述变化的多少,对应调整各文件夹下次遍历频率的高低。2.根据权利要求1所述的方法,其特征在于,所述步骤A包括:获取所有电子文件所在的各级文件夹的目录;依据所述目录将各级文件夹展开,形成图状遍历结构,获取文件夹数量;针对每个文件夹,对应生成一单独的单个文件夹遍历线程,通过遍历获取对应各文件夹内电子文件的数量。3.根据权利要求1所述的方法,其特征在于,所述步骤A包括:获取所有电子文件所在的各级文...

【专利技术属性】
技术研发人员:管延军蒋红宇李文琦白召明
申请(专利权)人:北京海泰方圆科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1