一种文件快速扫描方法和系统技术方案

技术编号:7592311 阅读:232 留言:0更新日期:2012-07-21 07:44
本申请提供了一种文件快速扫描方法和系统,涉及网络技术领域。本申请的方法包括:获取数据包;所述数据包包括用于确定系统中文件是否为安全文件的安全文件特征信息;逐个扫描系统中文件的文件特征信息,将当前扫描的文件特征信息与所述数据包中标示文件为安全文件的安全文件特征信息进行匹配;若匹配时,则跳过对当前文件的杀毒扫描,继续扫描下一个文件;若未匹配时,对当前文件进行杀毒扫描,当扫描时间大于或大于等于时间阈值并且安全时,将该文件的安全文件特征信息更新至数据包。本申请可减少首次扫描的时间,并且可及时更新所述数据包提供给本第用户端或者其他用户端使用。

【技术实现步骤摘要】

本申请涉及网络
,特别是涉及一种文件快速扫描方法和系统
技术介绍
随着计算机的普及,用户端基本上都需要安装杀毒软件对计算机内的文件进行扫描。在杀毒软件进行扫描时,需要大量的CPU运算和磁盘操作,使得扫描过程漫长而且影响系统速度。而对于计算机里的文件,有很多文件都是相同的,比如Windows的文件,很多软件的安装包文件,帮助文件,压缩文件等。现有技术中,用户端的杀毒软件第一次扫描时会全盘扫描计算机内的所有文件, 并且会扫描文件中的各种内容,如果对于包括内容比较大的文件,其扫描的时间耗费的相当多,从而导致第一次扫描的时间非常的长。比如对于压缩包,现有技术会按照正常的扫描流程将压缩包中的内容解压逐个进行扫描,以保证文件是安全的,这样对于一个压缩包来说,现有技术的扫描时间比较长,从而延长了整个扫描的时间,而对于用户来说,由于长时间的扫描而长时间占用的CPU运算和磁盘操作影响了系统的速度,从而影响的用户对计算机的使用。
技术实现思路
本申请所要解决的技术问题是提供一种文件快速扫描方法和系统,解决了新的用户端第一次扫描时间比较长的问题。为了解决上述问题,本申请公开了一种文件快速扫描方法,包括获取数据包;所述数据包包括用于确定系统中文件是否为安全文件的安全文件特征信息;逐个扫描系统中文件的文件特征信息,将当前扫描的文件特征信息与所述数据包中标示文件为安全文件的安全文件特征信息进行匹配;若匹配时,则跳过对当前文件的杀毒扫描,继续扫描下一个文件;若未匹配时,对当前文件进行杀毒扫描,当扫描时间大于或大于等于时间阈值并且安全时,将该文件的安全文件特征信息更新至数据包。优选的,所述特征信息通过统计各用户端发送到处理中心服务器中的安全文件特征息获得。优选的,通过如下步骤统计各用户端发送到处理中心服务器中的安全文件特征信息获得所述特征信息接收各用户端发送的安全文件特征信息;所述特征信息包括用户端完整扫描文件时,文件的扫描时间大于或大于等于时间阈值的安全的文件的特征信息;对于相同的特征信息,统计其重复次数;提取重复次数大于或大于等于数量阈值的特征信息。优选的,当所述文件的扫描时间大于或大于等于时间阈值时获取文件的特征信息,所述特征信息包括文件名、文件大小、文件修改时间和文件内容描述信息;将文件名进行循环冗余码校验计算,得到文件名CRC值;将文件内容描述信息进行消息摘要算法计算,得到内容匹配信息;将包括文件大小、文件修改时间、文件名CRC值和内容匹配信息的作为安全文件特征信息。优选的,对于相同的特征信息,统计其重复次数将接收的特征信息按总重复次数进行排序;对于各相同特征信息,将属于同一个用户端发送的相同特征消息进行消重运算;针对消重后的各相同特征信息,统计各特征消息的重复次数。优选的,在提取重复次数大于或大于等于数量阈值的特征信息之后包括将所述提取出来的特征信息存入数据文件,并依据所述数据文件生成数据包。优选的,在所述数据包生成之前还包括接收用户端发送的不安全文件的特征信息,不将该特征信息存入数据文件或者将数据包中与该特征信息相同的特征信息进行删除。优选的,在生成上一个数据包后,当统计到新的安全文件的特征信息后,更新至上一个数据包。优选的,通过如下方法将所述文件的特征信息与所述数据包中的特征信息进行匹配在缓存中从匹配效率最高的特征信息开始进行匹配。优选的,当文件大小和文件修改时间与数据库中的一条特征信息匹配时,则将文件名进行所述循环冗余码校验计算,得到文件名CRC值,并将所述文件名CRC值与该条特征信息的文件名CRC值进行匹配;当所述文件名CRC值与该条特征信息的文件名CRC值匹配时,则将文件内容描述信息进行所述消息摘要算法计算,得到内容匹配信息,并将所述内容匹配信息与该条特征信息的内容匹配信息进行匹配。优选的,当第一用户端进行第一次扫描时,提示第一用户端是否选择快速扫描,如果选择则扫描文件的特征信息,并调用所述数据包进行匹配。优选的,在第一用户端进行扫描时,将当次扫描结果中安全文件的特征信息存入所述数据包的安全文件信息列表;当第一用户端下一次进行扫描时根据上一次扫描后的记录进行扫描。相应的,本申请还公开了一种文件快速扫描系统,包括第一用户端,所述第一用户端包括获取模块,用于获取数据包;所述数据包包括用于确定系统中文件是否为安全文件的安全文件特征信息;扫描处理模块,用于逐个扫描系统中文件的文件特征信息,将当前扫描的文件特征信息与所述数据包中标示文件为安全文件的安全文件特征信息进行匹配;若匹配时,则跳过对当前文件的杀毒扫描,继续扫描下一个文件;若未匹配时,对当前文件进行杀毒扫描,当扫描时间大于或大于等于时间阈值并且安全时,将该文件的安全文件特征信息更新至数据包。优选的,还包括第二用户端群和处理中心服务器;所述处理中心服务器用于统计各用户端发送到处理中心服务器中的安全文件特征信息获得所述数据包中的特征信息;所述第二用户端群用于发送的安全文件的特征信息。优选的,所述的处理中心服务器包括特征信息模块,用于接收各用户端发送的安全文件的特征信息;所述特征信息包括用户端完整扫描文件时,文件的扫描时间大于或大于等于时间阈值的安全的文件的特征信息;统计模块,用于对于相同的特征信息,统计其重复次数;提取模块,用于提取重复次数大于或大于等于数量阈值的特征信息。优选的,所述第二用户端群的各用户端包括特征信息获取单元,用于当所述文件的扫描时间大于或大于等于时间阈值时,获取文件的特征信息,所述特征信息包括文件名、文件大小、文件修改时间和文件内容描述信息;文件名计算单元,用于将文件名进行循环冗余码校验计算,得到文件名CRC值;内容描述信息计算单元,用于将文件内容描述信息进行消息摘要算法计算,得到内容匹配信息;特征信息发送单元,用于将包括文件大小、文件修改时间、文件名CRC值和内容匹配信息的特征信息进行发送。优选的,所述统计模块包括排序单元,用于将接收的特征信息按总重复次数进行排序;消重单元,用于对于各相同特征信息,将属于同一个用户端发送的相同特征消息进行消重运算;统计单元,用于针对消重后的各相同特征信息,统计各特征消息的重复次数。优选的,在提取模块之后还包括生成单元,用于将所述提取出来的特征信息存入数据文件,并依据所述数据文件生成数据包。优选的,在所述数据包生成之前还包括去除单元,用于接收用户端发送的不安全文件的特征信息,不将该特征信息存入数据文件或者将数据包中与该特征信息相同的特征信息进行删除。优选的,还包括更新模块,用于在生成上一个数据包后,当统计到新的安全文件的特征信息后,更新至上一个数据包。优选的,通过如下方法将所述文件的特征信息与所述数据包中的特征信息进行匹配在缓存中从匹配效率最高的特征信息开始进行匹配。优选的,当文件大小和文件修改时间与数据库中的一条特征信息匹配时,则将文件名进行所述循环冗余码校验计算,得到文件名CRC值,并将所述文件名CRC值与该条特征信息的文件名CRC值进行匹配;当所述文件名CRC值与该条特征信息的文件名CRC值匹配时,则将文件内容描述信息进行所述消息摘要算法计算,得到内容匹配信息,并将所述内容匹配信息与该条特征信息的内容匹配信息进行匹配。优选的,还包括提醒模块,用于当第一次扫描时,提示第一用户端是否选择快速扫本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:邹贵强付旻
申请(专利权)人:奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术