The embodiment of the present invention discloses a method for identifying virus files, which belongs to the field of information processing technology. The method for identifying virus files provided in this application has strong robustness and can accurately identify variants of reference virus files by using the information entropy of the first fragmentation unit file as the hash of the target files in the process of judging whether the target file is a variant of the reference file. Effectively enhance the ability of virus file detection.
【技术实现步骤摘要】
一种病毒文件识别方法
本申请涉及信息处理
,尤其涉及一种病毒文件识别方法。
技术介绍
病毒文件检测通常采用消息摘要算法MD5等方法进行,但随着病毒软件的爆发式增长,很多病毒文件通过修改字节、插入、删除字节等方式,形成多种形式的变种病毒文件,现有的检测无法对该类变种病毒文件进行有效的检测。
技术实现思路
本专利技术实施例提供了一种能够有效的提升病毒文件检测准确性以及效率的病毒文件识别方法、设备以及计算机可读存储介质。本专利技术实施例第一方面提供了一种病毒文件识别方法,包括:通过专用链路获取目标文件;将所述目标文件拆分成多个第一分片单元文件;基于哈希算法分别计算多个所述第一分片单元文件的信息熵;根据所述第一分片单元文件的信息熵和预先设置的权重参数确定第一系数,其中所述第一系数为所述第一分片单元文件的信息熵和所述权重参数的乘积;根据所述第一系数获取第一熵向量,所述第一系数为所述第一熵向量的元素;获取基准文件,所述基准文件包含有病毒标签;将所述基准文件拆分成多个第二分片单元文件,所述第一分片单元文件和所述第二分片单元文件的数量相同;根据所述第二分片单元文件的信息熵和预先设置的权重参数的乘积获取第二系数,根据所述第二系数获取所述第二熵向量,所述第二系数为所述第二熵向量的元素;计算所述第一熵向量与第二熵向量的关联度系数值;根据所述关联度系数值确定所述目标文件是否与所述基准文件相关联,当所述关联度系数值大于预设门限值时,确定所述目标文件和所述基准文件相关联,将所述目标文件打上与所述基准文件相同的病毒标签。优选地,所述病毒文件识别方法中:所述第一熵向量为x=(x1,x2 ...
【技术保护点】
1.一种病毒文件识别方法,其特征在于,包括:通过专用链路获取目标文件;将所述目标文件拆分成多个第一分片单元文件;基于哈希算法分别计算多个所述第一分片单元文件的信息熵;根据所述第一分片单元文件的信息熵和预先设置的权重参数确定第一系数,其中所述第一系数为所述第一分片单元文件的信息熵和所述权重参数的乘积;根据所述第一系数获取第一熵向量,所述第一系数为所述第一熵向量的元素;获取基准文件,所述基准文件包含有病毒标签;将所述基准文件拆分成多个第二分片单元文件,所述第一分片单元文件和所述第二分片单元文件的数量相同;根据所述第二分片单元文件的信息熵和预先设置的权重参数的乘积获取第二系数,根据所述第二系数获取所述第二熵向量,所述第二系数为所述第二熵向量的元素;计算所述第一熵向量与第二熵向量的关联度系数值;根据所述关联度系数值确定所述目标文件是否与所述基准文件相关联,当所述关联度系数值大于预设门限值时,确定所述目标文件和所述基准文件相关联,将所述目标文件打上与所述基准文件相同的病毒标签。
【技术特征摘要】
1.一种病毒文件识别方法,其特征在于,包括:通过专用链路获取目标文件;将所述目标文件拆分成多个第一分片单元文件;基于哈希算法分别计算多个所述第一分片单元文件的信息熵;根据所述第一分片单元文件的信息熵和预先设置的权重参数确定第一系数,其中所述第一系数为所述第一分片单元文件的信息熵和所述权重参数的乘积;根据所述第一系数获取第一熵向量,所述第一系数为所述第一熵向量的元素;获取基准文件,所述基准文件包含有病毒标签;将所述基准文件拆分成多个第二分片单元文件,所述第一分片单元文件和所述第二分片单元文件的数量相同;根据所述第二分片单元文件的信息熵和预先设置的权重参数的乘积获取第二系数,根据所述第二系数获取所述第二熵向量,所述第二系数为所述第二熵向量的元素;计算所述第一熵向量与第二熵向量的关联度系数值;根据所述关联度系数值确定所述目标文件是否与所述基准文件相关联,当所述关联度系数值大于预设门限值时,确定所述目标文件和所述基准文件相关联,将所述目标文件打上与所述基准文件相同的病毒标签。2.根据权利要求1所述的病毒文件识别方法,...
【专利技术属性】
技术研发人员:林路路,
申请(专利权)人:建湖云飞数据科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。