用于文件病毒检测的特征获取方法及文件病毒检测的方法技术

技术编号:13196091 阅读:101 留言:0更新日期:2016-05-12 08:00
本发明专利技术提供一种用于文件病毒检测的特征获取方法及文件病毒检测的方法,用于文件病毒检测的特征获取方法包括:在样本文件的设定位置提取多个第一子特征,所述多个第一子特征形成第一特征向量;根据多个第二子特征的位置信息对所述多个第一子特征进行重新组合,得到第二特征向量;如果在第一特征库中未查询到所述第二特征向量中所包含的子特征,将所述第二特征向量作为所述样本文件的标识特征加入第二特征库。通过文件病毒检测的特征获取方法获取文件特征,若该文件特征不在第一特征库中,则将该文件特征作为文件的标识特征加入第二特征库,实现对第二特征库的不断更新,避免未知文件被误报,降低文件误报率。

【技术实现步骤摘要】

本专利技术涉及网络安全
,尤其涉及一种、装置。
技术介绍
随着计算机技术的快速发展和普及,大量的恶意文件(病毒)也随之滋生,从而严重影响了计算机技术的安全应用,造成严重的计算机安全隐患。目前,对恶意文件的检测且减少对非恶意文件的误报,大多采用MD5白名单技术,该技术是通过对每个非恶意文件生成一个MD5值作为标识,通过该标识阻止引擎对白名单中的文件作出恶意文件病毒检测结果,从而达到减少误报的目的。专利技术人发现,由于MD5白名单是通过将文件与标识进行一对一的比较,并不能通过同一特征来标识一批相似文件,随着文件特征的多元化,MD5白名单臃肿庞大,另外,由于MD5白名单不可能包括所有文件的标识,从而不能避免未知文件被误报。
技术实现思路
本专利技术的实施例提供一种、装置,实现在保护已知文件的同时,避免未知文件被误报。为达到上述目的,本专利技术的实施例采用如下技术方案:一种用于文件病毒检测的特征获取方法,该方法包括:在样本文件的设定位置提取多个第一子特征,所述多个第一子特征形成第一特征向量。根据多个第二子特征的位置信息对所述多个第一子特征进行重新组合,得到第二特征向量。如果在第一特征库中未查询到所述第二特征向量中所包含的子特征,将所述第二特征向量作为所述样本文件的标识特征加入第二特征库。一种文件病毒检测的方法,该方法包括:获取待测文件的特征信息。确定所述待测文件的特征信息是否在第二特征库中,所述第二特征库通过上述用于文件病毒检测的特征获取方法获取到。如果所述待测文件的特征信息不在所述第二特征库中,对所述特征信息进行启发式鉴定。如果所述待测文件的特征信息在所述第二特征库中,确定所述待测文件为非恶意文件。一种用于文件病毒检测的特征获取装置,该装置包括:第一获取模块,用于在样本文件的设定位置提取多个第一子特征,所述多个第一子特征形成第一特征向量。第二获取模块,用于根据多个第二子特征的位置信息对所述多个第一子特征进行重新组合,得到第二特征向量。第一更新模块,用于如果在第一特征库中未查询到所述第二特征向量中所包含的子特征,将所述第二特征向量作为所述样本文件的标识特征加入第二特征库。一种文件病毒检测的装置,该装置包括:第四获取模块,用于获取待测文件的特征信息;第一确定模块,用于确定所述待测文件的特征信息是否在第二特征库中,所述第二特征库通过上述技术方案所述的用于文件病毒检测的特征获取装置获取到;启发式鉴定模块,用于如果所述第一确定模块确定所述待测文件的特征信息不在所述第二特征库中,对所述特征信息进行启发式鉴定;第二确定模块,用于如果所述第一确定模块确定所述待测文件的特征信息在所述第二特征库中,确定所述待测文件为非恶意文件。本专利技术实施例提供的、装置,通过用于文件病毒检测的特征获取方法及装置文件病毒检测获取文件特征,若该文件特征不在第一特征库中,将该文件特征作为文件的标识特征加入第二特征库,实现对第二特征库的不断更新;文件病毒检测的方法及装置文件病毒检测基于所述用于文件病毒检测的特征获取方法文件病毒检测及装置以及其更新的第二特征库,获取待测文件的特征信息,并对待测文件进行检测,从而避免未知文件被误报,降低文件误报率。【附图说明】图1为本专利技术实施例的用于文件病毒检测的特征获取方法流程图。图2为本专利技术实施例的离线标识特征获取方法流程图。图3为本专利技术实施例的在线标识特征获取方法流程图。图4为本专利技术实施例的文件病毒检测的方法流程图。图5为本专利技术一实施例的用于文件病毒检测的特征获取装置的结构示意图。图6为本专利技术另一实施例的用于文件病毒检测的特征获取装置的结构示意图。图7为本专利技术一实施例的文件病毒检测的装置结构示意图。图8为本专利技术实施例的用于文件病毒检测的第二特征库生成过程示意图。图9为本专利技术实施例的离线标识特征示例性更新过程示意图。图10为本专利技术实施例的在线标识特征示例性更新过程示意图。图11为本专利技术实施例的文件病毒检测的示例性鉴定过程示意图。图12为本专利技术实施例的文件病毒检测的示例性学习过程示意图。【具体实施方式】下面结合附图对本专利技术实施例、装置进行详细描述。图1示出了本专利技术实施例的用于文件病毒检测的特征获取方法流程图。参照图1,用于文件病毒检测的特征获取方法包括如下步骤:步骤101,在样本文件的设定位置提取多个第一子特征,该多个第一子特征形成第一特征向量,执行步骤102。步骤102,根据多个第二子特征的位置信息对步骤101中形成的多个第一子特征进行重新组合,得到第二特征向量,执行步骤103。例如,可以通过特征优先表记录N个设定位置;在一个实施例中,在一样本文件的N个设定位置上提取N个第一子特征(例如,N个预定位置分别为a1、a2、a3、……、aN,从这N个位置处提取N个第一子特征Ap A2, A3,……、An),形成第一特征向量,根据优先指针指向特征优先表的位置,从N个第一子特征中选取M个第二子特征(其中,N〉=M)进行重新组合,例如,当前优先指针指向特征优先表中的as、a9、……、as+M,从该M个位置处获取第二子特征Ag、Ag、......、A_,得到第二特征向量。步骤103,确定是否能在第一特征库中查找到第二特征向量中所包含的多个子特征,如果否,则执行步骤104,如果是,则执行步骤105。步骤104,将第二特征向量作为样本文件的标识特征加入第二特征库。步骤105,重新调整多个第二子特征的位置信息,得到多个第二子特征对应的新的位置信息(例如,移动特征优先表的顺序,得到第二特征向量的对应的特征优先表的位置为as+M,现在可以将特征优先表移动至位置a9+M处),执行步骤106。步骤106,根据新的位置信息对多个第一子特征进行重新组合,得到第三特征向量,执行步骤107。例如,在第一特征库中查找到前述M个第二子特征组合得到的第二特征向量,则移动优先指针指向特征当前第1页1 2 3 4 本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/CN105574408.html" title="用于文件病毒检测的特征获取方法及文件病毒检测的方法原文来自X技术">用于文件病毒检测的特征获取方法及文件病毒检测的方法</a>

【技术保护点】
一种用于文件病毒检测的特征获取方法,其特征在于,所述方法包括:在样本文件的设定位置提取多个第一子特征,所述多个第一子特征形成第一特征向量;根据多个第二子特征的位置信息对所述多个第一子特征进行重新组合,得到第二特征向量;如果在第一特征库中未查询到所述第二特征向量中所包含的子特征,将所述第二特征向量作为所述样本文件的标识特征加入第二特征库。

【技术特征摘要】

【专利技术属性】
技术研发人员:曹德强冯侦探熊蜀光王新
申请(专利权)人:安一恒通北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1