【技术实现步骤摘要】
一种基于细粒度标注模型的恶意代码基因检测方法及装置
[0001]本公开涉及恶意代码基因检测领域,具体而言,涉及一种基于细粒度标注模型的恶意代码基因检测方法及装置
。
技术介绍
[0002]实际网络环境中的恶意代码自身会兼具多种恶意代码特征,而且多种恶意代码会通过一定的方式实现组合化
、
复杂化,增加破坏力
。
这样的恶意代码样本,往往包含一个或多个基因,例如某一个恶意代码可能既具有
Trojan
的特点,又具有
Virus
的特点,还有一些恶意代码兼具蠕虫和感染式恶意代码的特性,既能通过网络进行自我复制,又具有本地感染能力,即,同时具有通过网络进行自我复制能力和本地感染能力的恶意代码,这种情况下,仅仅通过计算整个恶意代码的相似性来判断其来源或同源性,无法得到准确结论
。
[0003]而现有技术的几种分类方法中:(1)现有将恶意代码转换成图像的方法,使用分类算法模型对恶意代码进行分类,通过分类结果判定恶意代码类型或家族来源
。
但都是对整个恶意代码样本转换成的图像直接进行分类,对具有多种基因的恶意代码直接判定为其中一个类别,没有对细粒度基因的检测识别,不能解决前面所描述的恶意代码基因复杂多样的问题
。
[0004](2)现有基于卷积神经网络的恶意代码图像分类方法中,由于卷积神经网络模型的输入尺寸固定,为了解决恶意代码大小不一,无法输入的问题,通常使用裁剪或补充的方法,将恶意代码图像裁剪成相同大小,或者 ...
【技术保护点】
【技术特征摘要】
1.
一种基于细粒度标注模型的恶意代码基因检测方法,其特征在于,所述方法包括:基于二进制的字节流图像化编码技术,通过对恶意代码样本进行图像矢量映射,生成恶意代码矢量图像,通过预设图像处理方法对所述恶意代码矢量图像进行处理,生成恶意代码特征图像;通过设立滑动窗口对所述恶意代码特征图像进行切分,生成恶意代码特征图像小块集,基于所述恶意代码特征图像小块集的细粒度基因检测,通过对
Transformer
模型中的
encoder
‑
decoder
结构进行构建,生成细粒度模型;基于恶意代码标签数据集,通过对所述细粒度模型进行训练,生成细粒度标注模型,基于所述细粒度标注模型,完成对恶意代码的基因检测
。2.
如权利要求1所述的基于细粒度标注模型的恶意代码基因检测方法,其特征在于,所述方法还包括:基于二进制的字节流图像化编码技术,通过对二进制字节流进行信息提取,生成二进制字节流数值矩阵;基于二进制的字节流图像化编码技术,通过对字节结构化进行特征提取,生成字节结构化特征数值矩阵;基于二进制的字节流图像化编码技术,通过对二进制字节流进行噪音添加,生成噪音字节流数值矩阵;通过对所述二进制字节流数值矩阵
、
字节结构化特征数值矩阵
、
噪音字节流数值矩阵进行复合,生成所述恶意代码矢量图像
。3.
如权利要求2所述的基于细粒度标注模型的恶意代码基因检测方法,其特征在于,所述方法还包括:通过预设图像处理方法对所述恶意代码矢量图像进行视觉突出处理,生成恶意代码视觉突出图像;基于小波与
Retinex
算法的图像增强处理方法,通过对所述恶意代码视觉突出图像进行特征预设增强处理,生成所述恶意代码特征图像
。4.
如权利要求1所述的基于细粒度标注模型的恶意代码基因检测方法,其特征在于,所述方法还包括:基于恶意代码特征图像尺寸
、
预设恶意代码特征图像小块尺寸,对所述滑动窗口进行设置,生成滑动窗口步长;基于所述滑动窗口步长,将所述滑动窗口按照从左到右
、
从上到下在所述恶意代码特征图像上进行移动,生成所述恶意代码特征图像小块集
。5.
如权利要求4所述的基于细粒度标注模型的恶意代码基因检测方法,其特征在于,所述方法还包括:基于
Transformer
模型,通过线性投射层将所述恶意代码...
【专利技术属性】
技术研发人员:黄娜,任祥辉,姜海,
申请(专利权)人:中国电子科技集团公司第十五研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。