一种基于深度学习的木马家族分类方法和系统技术方案

技术编号：35077896 阅读：16 留言：0更新日期：2022-09-28 11:44

本发明专利技术提供一种基于深度学习的木马家族分类方法和系统，通过将木马的代码转换为灰度图像，并且为了克服灰度图像的精确度缺陷，在灰度图像的基础上，补充了一个木马的特征值的维度，更加突显某些木马家族的特征，把木马的分类问题转换为图像的分类问题，从而借助深度学习在图像分类上的优势，解决已知检测手段跟不上木马的迭代速度的问题。不上木马的迭代速度的问题。不上木马的迭代速度的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的木马家族分类方法和系统

[0001]本申请涉及网络安全
，尤其涉及一种基于深度学习的木马家族分类方法和系统。

技术介绍

[0002]随着网络的飞速发展，恶意软件的数量呈指数级增长，恶意代码已经成为当今网络的主要威胁。恶意代码，以下以木马为例，通常都有一个演化的过程，会衍生和迭代出很多不同的版本，这些不同版本的木马往往具有一定的相关性，可以将它们归为一个木马家族。
[0003]由于已知检测手段跟不上木马的迭代速度，需要能够根据木马家族特点溯源和归纳出针对整个木马家族的通用性防护措施。
[0004]同时，随着机器学习的快速发展，深度学习技术将会在特征溯源和归纳中发挥不可替代的作用，能够快速、准确地处理海量数据。
[0005]因此，急需一种针对性的基于深度学习的木马家族分类方法和系统。

技术实现思路

[0006]本专利技术的目的在于提供一种基于深度学习的木马家族分类方法和系统，将木马的代码转换为图像，把木马的分类问题转换为图像的分类问题，从而借助深度学习在图像分类上的优势，解决已知检测手段跟不上木马的迭代速度的问题。
[0007]第一方面，本申请提供一种基于深度学习的木马家族分类方法，所述方法包括：
[0008]接收外部装置送入的木马，提取该木马的二进制代码和特征值，将所述二进制代码编码映射为第一一维向量，将所述特征值向量化为第二一维向量，每个向量值的范围限定在0
‑
255之间；
[0009]根据木马文件的大小设定木马...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的木马家族分类方法，其特征在于，所述方法包括：接收外部装置送入的木马，提取该木马的二进制代码和特征值，将所述二进制代码编码映射为第一一维向量，将所述特征值向量化为第二一维向量，每个向量值的范围限定在0
‑
255之间；根据木马文件的大小设定木马图像的宽度，创建一个二维数组矩阵，所述木马图像的宽度作为该二维数组矩阵的列数；将所述第一一维向量的向量值逐个写入所述二维数组矩阵中，再将所述第二一维向量的向量值逐个接着写入所述二维数组矩阵中，将所述二维数组矩阵的每一个点作为一个灰度像素点，得到对应的所述木马图像；按照服务器的分类器所需的宽度，将所述木马图像进行统一预处理，当该木马图像的宽度不满足分类器所需的宽度时，采用图像插值算法，对木马图像进行图像缩放处理，得到待分类木马图像，送入服务器的分类器；所述分类器采用神经网络，接收输入的所述待分类木马图像，并且使用若干神经元组成双向隐藏层，所述神经元分为两组，一组为前向反馈线路，另一组为反向反馈线路，由此形成双向线路，每个反馈线路中的当前神经元接收上一个神经元传递来的隐藏层信息，以及接收所述上一个神经元相邻的邻居神经元传递来的状态信息，输出当前时刻的隐藏层信息和当前神经元更新后的状态信息，输出至所述时序特征模块的累加单元进行元素对位相加；提取神经网络的全连接中间层输出作为所述待分类木马图像的新特征，根据该新特征进行分类，根据所述分类的结果确定出所述待分类木马图像对应的木马家族，向外部装置下发该木马家族对应的通用性防护措施。2.根据权利要求1所述的方法，其特征在于：所述采用图像插值算法包括：最近邻插值算法、双线性插值算法和双三次插值算法。3.根据权利要求1所述的方法，其特征在于：所述提取该木马的二进制代码和特征值之前，还包括侦测出该木马代码的加壳类型和签名，针对不同的加壳木马代码进行脱壳处理。4.根据权利要求2或3任一项所述的方法，其特征在于：所述分类包括多次抽取，创建多棵决策树，将每棵决策树的输出结果进行加权累加投票。5.一种基于深度学习的木马家族分类系统，其特征在于，所述...

【专利技术属性】
技术研发人员：周瑞红，刘玉佳，侯小超，
申请(专利权)人：北京国瑞数智技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人