病毒检测方法和装置制造方法及图纸

技术编号:11756422 阅读:136 留言:0更新日期:2015-07-22 04:27
本发明专利技术公开了一种病毒检测方法和装置。该病毒检测方法包括获取待检测文件的文件样本特征;将文件样本特征存储至搜索引擎中;获取文件病毒特征;以及利用搜索引擎对文件样本特征进行搜索,并将搜索得到的与文件病毒特征匹配的文件样本特征对应的文件作为病毒可疑文件。通过本发明专利技术,解决了现有技术中对病毒文件的检测效率比较低的问题,进而达到了提高病毒检测效率的效果。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,具体而言,涉及一种病毒检测方法和装置
技术介绍
目前,计算机病毒分析人员将病毒正式入库下发用户之前,首先搜集样本特征,然后按照提取出来的病毒特征对搜集到的样本特征做预检测,查看是否有误杀。现有技术中,通常是将预搜集出来的百万级样本特征打包为wup格式,再逐个拆包检测是否有可疑样本。假定当前样本特征的个数是800W,每日新增个数为3W,将这些搜集到的样本特征部署在16个机器中,每个机器通过8进程加载wup包,则对所有搜集到的样本特征进行处理耗时大约8分钟。因此,随着样品特征数量的日益增长,对样品特征进行处理耗费的时间也越来越长,相应地,对搜集到的样本特征进行检测的效率也比较低。针对现有技术中对病毒文件的检测效率比较低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例的主要目的在于提供一种病毒检测方法和装置,以解决现有技术中对病毒文件的检测效率比较低的问题。为了实现上述目的,根据本专利技术实施例的一个方面,提供了一种病毒检测方法。该病毒检测方法包括:获取待检测文件的文件样本特征;将文件样本特征存储至搜索引擎中;获取文件病毒特征;以及利用搜索引擎对文件样本特征进行搜索,并将搜索得到的与文件病毒特征匹配的文件样本特征对应的文件作为病毒可疑文件。为了实现上述目的,根据本专利技术实施例的另一方面,提供了一种病毒检测装置。该病毒检测装置包括:第一获取单元,用于获取待检测文件的文件样本特征;存储单元,用于将文件样本特征存储至搜索引擎中;第二获取单元,用于获取文件病毒特征;以及搜索单元,用于利用搜索引擎对文件样本特征进行搜索,并将搜索得到的与文件病毒特征匹配的文件样本特征对应的文件作为病毒可疑文件。通过本专利技术实施例,解决了现有技术中对病毒文件的检测效率比较低的问题,进而达到了提高病毒检测效率的效果。【附图说明】构成本申请的一部分的附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术第一实施例的病毒检测方法的流程图;图2是根据本专利技术实施例的病毒检测方法中执行匹配搜索的流程图;图3是根据本专利技术第二实施例的病毒检测方法的流程图;图4是根据本专利技术第一实施例的病毒检测装置的示意图;图5是根据本专利技术第二实施例的病毒检测装置的示意图;以及图6是根据本专利技术第三实施例的病毒检测装置的示意图。【具体实施方式】需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本专利技术实施例提供一种病毒检测方法。图1是根据本专利技术第一实施例的病毒检测方法的流程图。如图所示,该病毒检测方法包括如下步骤:步骤S101,获取待检测文件的文件样本特征。待检测文件包括针对安卓系统的.apk文件、.nbh文件等,在待检测文件中可以提取的文件样本特征包括常量字符串、包名、证书、类名、文件版本、资源名和文件大小等特征信息。常量字符串是一对双引号括起来的字符序列,例如“how do you do”,“CHINA”,“$123.45”。病毒文件的文件样本特征可能与待检测文件的文件样本特征相同,为了发现待检测文件中的病毒文件,并避免在杀毒过程中误杀非病毒文件,因此,将可能存在病毒的文件或者可能被误杀的文件作为待检测文件。步骤S102,将文件样本特征存储至搜索引擎中。存储文件样本特征的搜索引擎服务器可以是solr,solr是一个基于Lucene的Java搜索引擎服务器。Lucene是一个基于Java的全文信息检索工具包,可以为应用程序提供索引和搜索功能。Lucene能够为文本类型的数据建立索引,所以,只需将需要进行索引的数据格式转化成文本格式,Lucene就能够对数据进行索引和搜索。例如,对一些HTML文档和PDF文档进行索引,首先需要把HTML文档和PDF文档转化成文本格式,然后将转化后的内容交给Lucene进行索引,然后把创建好的索引文件保存到磁盘或者内存中,最后,在索引文件中查询需要的数据内容。将文件样本特征存储在搜索引擎中之后,利用搜索引擎对文本样本特征进行病毒检测。步骤S103,获取文件病毒特征。利用文件病毒特征查询文件样本特征,满足文件病毒特征的文件样本特征为可疑病毒,在经过校验确认之后,该文件样本特征对应的文件样本可能为文件病毒,也可能不是病毒。文件病毒特征包括常量字符串、包名、证书、类名、文件版本、资源名和文件大小等特征信息。步骤S104,利用搜索引擎对文件样本特征进行搜索,并将搜索得到的与文件病毒特征匹配的文件样本特征对应的文件作为病毒可疑文件。利用搜索引擎solr对文件样本特征进行搜索,搜索存储于搜索引擎中的文件样本特征,如果搜索到搜索引擎中的文件样本特征存在与文件病毒特征匹配的文件样本特征,则将搜索到的文件样本特征作为病毒可疑文件。由于文件病毒特征包括多个文件病毒特征,可以逐个对每个文件病毒特征在所有文件样本特征中进行搜索,从而全面搜索是否有与文件病毒特征相匹配的文件样本特征,并将搜索得到的与文件病毒特征相匹配的文件样本特征对应的文件作为病毒可疑文件。通过本专利技术的上述实施例,将文件样本特征存储在搜索引擎中,并利用搜索引擎的全文搜索功能,只需要将文件病毒特征输入至搜索引擎中,即可搜索与文件病毒特征匹配的文件样本特征,并将文件样本特征对应的文件作为病毒可疑文件。在搜索与文件病毒特征匹配的文件样本特征的过程中,无需对文件样本特征进行打包处理,可以直接利用文件病毒特征在文件样本特征中进行搜索,耗时约为3至5秒,大大缩短了对文件样本特征的搜索时间,从而提高了文件的病毒检测效率。图2是根据本专利技术实施例的病毒检测方法中执行匹配搜索的流程图。如图所示,该病毒检测方法通过接收病毒分析人员输入的文件病毒特征获取文件病毒特征,利用搜索引擎对文件样本特征进行搜索,并将搜索得到的与文件病毒特征匹配的文件样本特征对应的文件作为病毒可疑文件,具体步骤如下:步骤S201,通过接收得到的病毒分析人员输入的第一文件病毒特征执行搜索,得到第一搜索结果。文件病毒特征包括常量字符串、包名、证书、类名、文件版本、资源名和文件大小等特征信息,病毒分析人员可以根据选择上述文件病毒特征中的任一病毒特征作为第本文档来自技高网
...

【技术保护点】
一种病毒检测方法,其特征在于,包括:获取待检测文件的文件样本特征;将所述文件样本特征存储至搜索引擎中;获取文件病毒特征;以及利用所述搜索引擎对所述文件样本特征进行搜索,并将搜索得到的与所述文件病毒特征匹配的文件样本特征对应的文件作为病毒可疑文件。

【技术特征摘要】

【专利技术属性】
技术研发人员:杨翔文管胜
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1