【技术实现步骤摘要】
识别恶意文件的方法、装置、电子设备及存储介质
本公开涉及网络安全领域,具体涉及一种识别恶意文件的方法、装置、电子设备及存储介质。
技术介绍
在互联网遍及生活各个角落的今天,用户的个人终端常常会遭到不法人员的攻击,例如,不法人员于用户的个人终端中植入病毒文件、木马文件之类的恶意文件,从而破坏用户的个人终端的正常运行、或者窃取用户的隐私信息。为了保护用户免于恶意文件的危害,需要对恶意文件进行识别,从而对恶意文件进行打击。现有技术中,识别恶意文件多是基于如MD5算法之类的高复杂度的摘要算法计算得到待识别文件的摘要,再将其与恶意文件的摘要进行对比,从而进行识别。但由于如MD5算法之类的高复杂度的摘要算法常常需要极大的运算能力,会给用户的个人终端造成极大的负担,从而导致恶意文件的识别效率低下。
技术实现思路
本公开的一个目的在于提出一种识别恶意文件的方法、装置、电子设备及存储介质,能够提高识别恶意文件的效率。根据本公开实施例的一方面,公开了一种识别恶意文件的方法,包括:根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵;基于所述待识别文件元素矩阵中每一第一类元素集合,生成该第一类元素集合的第一向量,并基于所述待识别文件元素矩阵中每一第二类元素集合,生成该第二类元素集合的第二向量,其中,第一类元素集合、第二类元素集合是根据预定元素划分规则对所述待识别文件元素矩阵中的元素进行划分确定的;对各第一类元素集合的第一向量的组合向量求摘要,得到所述待识别文件的第一摘要;对各第二类元素集合的第二向量的组合向量求摘要, ...
【技术保护点】
1.一种识别恶意文件的方法,其特征在于,所述方法包括:根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵;基于所述待识别文件元素矩阵中每一第一类元素集合,生成该第一类元素集合的第一向量,并基于所述待识别文件元素矩阵中每一第二类元素集合,生成该第二类元素集合的第二向量,其中,第一类元素集合、第二类元素集合是根据预定元素划分规则对所述待识别文件元素矩阵中的元素进行划分确定的;对各第一类元素集合的第一向量的组合向量求摘要,得到所述待识别文件的第一摘要;对各第二类元素集合的第二向量的组合向量求摘要,得到所述待识别文件的第二摘要;对待识别文件的第一摘要和第二摘要的组合向量求摘要,得到所述待识别文件的索引摘要;将所述待识别文件的索引摘要与预设恶意文件库中恶意文件的索引摘要对比,从而确定所述待识别文件是否为恶意文件。
【技术特征摘要】
1.一种识别恶意文件的方法,其特征在于,所述方法包括:根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵;基于所述待识别文件元素矩阵中每一第一类元素集合,生成该第一类元素集合的第一向量,并基于所述待识别文件元素矩阵中每一第二类元素集合,生成该第二类元素集合的第二向量,其中,第一类元素集合、第二类元素集合是根据预定元素划分规则对所述待识别文件元素矩阵中的元素进行划分确定的;对各第一类元素集合的第一向量的组合向量求摘要,得到所述待识别文件的第一摘要;对各第二类元素集合的第二向量的组合向量求摘要,得到所述待识别文件的第二摘要;对待识别文件的第一摘要和第二摘要的组合向量求摘要,得到所述待识别文件的索引摘要;将所述待识别文件的索引摘要与预设恶意文件库中恶意文件的索引摘要对比,从而确定所述待识别文件是否为恶意文件。2.根据权利要求1所述的方法,其特征在于,预设恶意文件库中恶意文件的索引摘要预先通过以下方式获得:根据预定数据分组规则对恶意文件的数据分组,分成的每一组数据作为恶意文件元素矩阵中的一个元素,组成恶意文件元素矩阵;基于所述恶意文件元素矩阵中每一第一类元素集合,生成该第一类元素集合的第一向量,并基于所述恶意文件元素矩阵中每一第二类元素集合,生成该第二类元素集合的第二向量,其中,第一类元素集合、第二类元素集合是根据预定元素划分规则对所述恶意文件元素矩阵中的元素进行划分确定的;对各第一类元素集合的第一向量的组合向量求摘要,得到所述恶意文件的第一摘要;对各第二类元素集合的第二向量的组合向量求摘要,得到所述恶意文件的第二摘要;对恶意文件的第一摘要和第二摘要的组合向量求摘要,得到所述恶意文件的索引摘要。3.根据权利要求1所述的方法,其特征在于,所述待识别文件的数据包括待识别文件的二进制表示中的字节,所述根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵,包括:从所述待识别文件的二进制表示中按顺序将每预定数目个字节,作为一个元素取出,按自上而下、从左到右的顺序填入预设矩阵宽度的空白矩阵中。4.根据权利要求1所述的方法,其特征在于,所述待识别文件的数据包括待识别文件的字符,所述根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵,包括:从所述待识别文件中按顺序将预定数目个字符,并转换成比特串作为一个元素取出,按自上而下、从左到右的顺序填入预设矩阵宽度的空白矩阵中。5.根据权利要求3或4所述的方法,其特征在于,在按自上而下、从左到右的顺序填入预设矩阵宽度的空白矩阵中之后,所述方法还包括:如果对于所述待识别文件,所有元素已取出完毕,在所述空白矩阵中未填充的位置填入预定占位符。6.根据权利要求1所述的方法,其特征在于,在根据预定数据分组规则对待识别文件的数据分组,分成的每一组数据作为待识别文件元素矩阵中的一个元素,组成待识别文件元素矩阵之后,所述方法还包括:在待识别文件元素矩阵中引入第一混淆因子,所述第一混淆因子包括以下中的至少一项:待识别文件元素矩阵中每个元素后拼接的预设比特;在待识别文件元素矩阵中预定行数位置增加的预设的元素行。7.根据权利要求1所述的方法,其特征在于,根据预定的元素划分规则将所述待识别文件元素矩阵中每一行元素确定为对应的第一类元素集合,将所述待识别文件元素矩阵中每一列元素确定为对应的第二类元素集合,所述基于所述待识别文件元素矩阵中每一第一类元素集合,生成该第一类元素集合的第一向量,并基于所述待识别文件元素矩阵中每一第二类元素集合,生成该第二类元素集合的第二向量,包括:基于所述待识别文件元素矩阵中行的元素,生成该...
【专利技术属性】
技术研发人员:朱学文,罗丹,
申请(专利权)人:深圳市腾讯网域计算机网络有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。