对非病毒文件自动提取特征的方法和装置制造方法及图纸

技术编号：4210674 阅读：237 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及计算机杀毒软件领域，尤其涉及一种对非病毒文件自动提取特征的方法和装置。对非病毒文件自动提取特征的方法，在非病毒文件中选取Ｎ个适合提取非病毒特征的固定位置，每个固定位置分配一个位置ＩＤ号，以其中Ｍ个固定位置的位置ＩＤ号和这Ｍ个固定位置所对应的特征值作为非病毒特征；所述特征值是指以某个所述固定位置为起点，取长度为Ｌ的一段二进制数据来计算的ＨＡＳＨ值；其中Ｎ≥２，Ｍ≥２且Ｍ≤Ｎ，Ｌ＞０。上述方法大大提高了文件扫描的速度；而且可以用一个非病毒特征匹配大量的相似或者相同的非病毒文件。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机杀毒软件领域，尤其涉及一种对非病毒文件自动提取特征的方法和装置。
技术介绍
杀毒软件在计算机上进行病毒扫描需要花费大量的时间，还会占用大量的系统资源，这是因为病毒识别是一个复杂的过程。考虑到大多数计算上的文件都是一样的，并且都是非病毒文件(即白文件)居多，例如操作系统的文件、常用软件的文件，如果能够在进行病毒文件识别之前高效的识别出这些白文件，避免进行复杂的病毒识别过程，杀毒软件的性能将得到很大的提升，扫描过程花费较短的时间，占用较少的系统资源。目前对白文件的一般识别方法为基于白文件的二进制数据，提取出白特征(即非病毒特征)；然后，在对文件进行病毒扫描时，通过匹配白特征来识别白文件。目前常用的提取白特征的方法为对于一个白文件，计算整个文件数据的HASH值来作为特征值。此方法具有以下不足 (1)识别白文件的效率不高。因为需要对整个文件计算HASH值，所以在白文件识别时，会占用大量的系统资源(包括磁盘IO和CPU等)，花费大量的时间。在整个病毒扫描过程中表现为，自身扫描速度变慢，影响计算机上其他程序的正常运行。 (2)—条白特征只能识别一个白文件。面对大量的白文件，这样会导致产生大量的白特征。特征数量变的庞大了，扫描速度也会变慢。
技术实现思路
本专利技术的第一目的是克服现有技术中的不足，提供一种对非病毒文件自动提取特征的方法，使用该方法提取的非病毒特征可识别大量的非病毒文件，而且使用该非病毒特征进行文件识别时的扫描速度快。本专利技术的第二目的是提供一种执行上述对非病毒文件自动提取特征方法的装置。为了实现上述第一目的，采用以下...

【技术保护点】
对非病毒文件自动提取特征的方法，其特征在于，在非病毒文件中选取Ｎ个适合提取非病毒特征的固定位置，每个固定位置分配一个位置ＩＤ号，以其中Ｍ个固定位置的位置ＩＤ号和这Ｍ个固定位置所对应的特征值作为非病毒特征；所述特征值是指以某个所述固定位置为起点，取长度为Ｌ的一段二进制数据来计算的ＨＡＳＨ值；其中Ｎ≥２，Ｍ≥２且Ｍ≤Ｎ，Ｌ＞０。

【技术特征摘要】

【专利技术属性】
技术研发人员：彭宁，梅银明，钟东，邱锐锋，包德荣，刘海峰，
申请(专利权)人：珠海市君天电子科技有限公司，
类型：发明
国别省市：44[中国|广东]

全部详细技术资料下载我是这个专利的主人