System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种面向恶意代码图像的可解释性评估方法技术_技高网

一种面向恶意代码图像的可解释性评估方法技术

技术编号:39949062 阅读:5 留言:0更新日期:2024-01-08 23:09
本发明专利技术涉及一种面向恶意代码图像的可解释性评估方法。增强基于恶意代码图像的检测模型结果的可信度,为恶意代码家族分类结果提供可解释性评估。首先,经过数据预处理生成恶意代码样本对应的灰度图像和马尔可夫图像。利用生成的恶意代码图像数据,构建基于卷积神经网络判别模型。接着,利用梯度加权类激活映射Grad‑CAM方法,根据输入数据生成对应的热图,并将属于同一家族的热图进行叠加,得到代表家族特征的累积热图。然后,基于图像余弦相似度对家族内部和不同家族之间的样本数据进行热图相似性计算。最后,通过观察各家族累积热图特征并对比家族内部和不同家族之间的平均热图相似性,为基于恶意代码图像的恶意代码家族分类结果提供可解释性评估。

【技术实现步骤摘要】

本专利技术属于网络安全,特别涉及一种面向恶意代码图像的可解释性评估方法


技术介绍

1、随着计算机技术的快速发展,恶意代码的种类和数量不断增加,这增加了安全专业人员的挑战。近年来,智能化恶意代码检测方法逐渐受到重视,并取得了较好的结果。然而,基于深度学习的恶意代码检测模型存在着“黑盒”特性,缺乏可解释性,安全研究人员无法理解模型产出特定决策的原因,难以建立对模型决策的信任。恶意代码图像是一种表示恶意代码的图像,这种表示方法可以帮助安全专业人员更好地理解恶意代码的结构和行为。对恶意代码检测模型进行可解释性评估,增强恶意代码检测模型预测结果的可信度,可以帮助安全专业人员更准确地识别恶意代码,更好地保护计算机系统和网络。


技术实现思路

1、本专利技术的目的在于针对现有技术存在的缺陷和实际需求,提供一种面向恶意代码图像的可解释性评估方法,能够有效地识别恶意代码并提供其分类结果的可解释性评估,提高恶意代码检测的准确性和可解释性,有助于建立对深度学习技术的信任,使得安全研究人员很难根据训练结果有针对性地进行调优,能为实际网络环境中安全防护提供有力的技术支撑。

2、本专利技术方案旨在提高恶意代码检测的准确性和可解释性,有效地识别恶意代码并提供其分类结果的可解释性评估。首先,经过数据预处理生成恶意代码样本对应的灰度图像和马尔可夫图像。利用生成的恶意代码图像数据,构建基于卷积神经网络的恶意代码图像分类模型。然后,使用局部可解释性方法,获取特定恶意代码图像样本在模型决策过程中的关键特征,计算模型的梯度信息,根据模型预测结果对输入数据生成对应的热图,并叠加属于同一家族的热图,为每一个家族生成累积热图。最后,计算家族内部的平均热图相似性以及不同家族之间的平均热图相似性,以评估模型预测结果的合理性,了解模型是否正确地学习。

3、为实现上述目的,本专利技术的技术方案是:一种面向恶意代码图像的可解释性评估方法,包括如下步骤:

4、步骤s1、对恶意代码样本进行数据预处理,生成基于字节流的灰度图像和基于操作码的马尔可夫图像;

5、步骤s2、将预处理生成的恶意代码图像作为模型数据,构建卷积神经网络判别模型;

6、步骤s3、根据模型预测,基于梯度加权类激活映射方法grad-cam生成对应恶意代码图像热图;

7、步骤s4、基于相同家族的恶意代码图像热图,生成家族对应的累积热图;

8、步骤s5、对各个家族的热图文件夹和混合家族的热图文件夹分别进行热图相似性计算;

9、步骤s6、根据家族累积热图和热图相似性计算结果对模型进行可解释性评估。

10、在本专利技术一实施例中,步骤s1中,生成恶意代码样本基于字节流的灰度图像,具体包括以下步骤:

11、步骤s1a1、将恶意代码样本二进制字节流中的每8位二进制数据转化为0-255的十进制数值,生成十进制一维数组;

12、步骤s1a2、将读取的一维数组转化成固定列的二维数组;

13、步骤s1a3、将二维数组转化为灰度图像,并要对图像大小进行缩放处理,统一图像大小。

14、在本专利技术一实施例中,步骤s1中,生成恶意代码样本基于操作码的马尔可夫图像,具体包括以下步骤:

15、步骤s1b1、从恶意代码的反汇编asm文件中提取恶意代码操作码序列;

16、步骤s1b2、引入马尔可夫假设,计算操作码序列的马尔可夫转移概率矩阵tm;

17、步骤s1b3、根据计算马尔可夫转移概率矩阵,生成马尔可夫图像。

18、在本专利技术一实施例中,步骤s1b1中,从恶意代码的反汇编asm文件中提取恶意代码操作码序列,具体包括以下步骤:

19、步骤s1b11、将恶意代码样本进行反汇编操作,获取asm文件;

20、步骤s1b12、通过匹配segment type:pure code定位代码节位置,获取代码节名称;

21、步骤s1b13、根据得到的代码节名称匹配代码节区内容,按行读取代码节中的内容;

22、步骤s1b14、通过正则匹配,获取文件所包含的操作码,提取二进制文件的操作码序列;

23、步骤s1b15、选取出现次数较多的前255种操作码类型,将其余操作码类型统一为第256种操作码,并标记为0-255号,将提取的操作码序列转化为由十进制数0-255组成的一维数组。

24、在本专利技术一实施例中,步骤s1b3中,根据计算马尔可夫转移概率矩阵,生成马尔可夫图像,具体包括以下步骤:

25、步骤s1b31、获取马尔可夫转移概率矩阵中的最大值mp;

26、步骤s1b32、将马尔可夫转移概率矩阵中的概率值乘以255/mp,并进行模256计算;

27、步骤s1b33、将步骤s2b32计算后的数组转化为马尔可夫图像。

28、在本专利技术一实施例中,步骤s2中,将预处理生成的恶意代码图像作为模型数据,构建卷积神经网络判别模型,具体包括以下步骤:

29、步骤s21、使用生成的恶意代码图像样本构建数据集,划分为训练集和测试集;

30、步骤s22、构建面向恶意代码图像分类的卷积神经网络判别模型,并使用训练集对其进行训练。

31、在本专利技术一实施例中,步骤s3中,对于各个家族的热图文件夹根据模型预测,基于grad-cam生成对应恶意代码图像的热图,具体包括以下步骤:

32、步骤s31、将测试集数据输入卷积神经网络判别模型进行预测;

33、步骤s32、获取模型的最后一层卷积层;

34、步骤s33、获取模型输出层;

35、步骤s34、利用反向传播的梯度计算权重,生成对应的热图。

36、在本专利技术一实施例中,步骤s4中,根据各个家族的恶意代码样本热图生成对应的累积热图,具体包括以下步骤:

37、步骤s41、将生成的热图按照家族标签分类,为每个恶意代码家族构建一个热图文件夹;

38、步骤s42、将每个家族的累积热图为各通道像素均为0的图像;

39、步骤s43、家族对应的累积热图叠加上家族热图文件夹中的热图,并进行平均,得到最终的家族累积热图。

40、在本专利技术一实施例中,步骤s5中,对各个家族的热图文件夹和混合家族的热图文件夹分别进行热图相似性计算,具体包括以下步骤:

41、步骤s51、将生成的热图按照家族标签分类,为每个恶意代码家族构建一个热图文件夹;

42、步骤s52、取来自不同家族的恶意代码样本对应的热图构建一个混合家族的热图文件;

43、步骤s53、计算属于同一个热图文件夹中两两热图之间的余弦相似度;

44、步骤s54、对热图文件夹中所计算的热图相似性进行求和平均,获得各个家族平均热图相似性和混合家族平均热图相似性。

45、在本专利技术一实施例中,步骤s6中,根据家族累积热图和热图相似性计算结果本文档来自技高网...

【技术保护点】

1.一种面向恶意代码图像的可解释性评估方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤S1中,生成恶意代码样本基于字节流的灰度图像,具体包括以下步骤:

3.根据权利要求1所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤S1中,生成恶意代码样本基于操作码的马尔可夫图像,具体包括以下步骤:

4.根据权利要求3所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤S1B1中,从恶意代码的反汇编asm文件中提取恶意代码操作码序列,具体包括以下步骤:

5.根据权利要求3所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤S1B3中,根据计算马尔可夫转移概率矩阵,生成马尔可夫图像,具体包括以下步骤:

6.根据权利要求1所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤S2中,将预处理生成的恶意代码图像作为模型数据,构建卷积神经网络判别模型,具体包括以下步骤:

7.根据权利要求6所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤S3中,对于各个家族的热图文件夹根据模型预测,基于Grad-CAM生成对应恶意代码图像的热图,具体包括以下步骤:

8.根据权利要求1所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤S4中,根据各个家族的恶意代码样本热图生成对应的累积热图,具体包括以下步骤:

9.根据权利要求1所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤S5中,对各个家族的热图文件夹和混合家族的热图文件夹分别进行热图相似性计算,具体包括以下步骤:

10.根据权利要求1所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤S6中,根据家族累积热图和热图相似性计算结果对模型进行可解释性评估,具体包括以下步骤:

...

【技术特征摘要】

1.一种面向恶意代码图像的可解释性评估方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤s1中,生成恶意代码样本基于字节流的灰度图像,具体包括以下步骤:

3.根据权利要求1所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤s1中,生成恶意代码样本基于操作码的马尔可夫图像,具体包括以下步骤:

4.根据权利要求3所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤s1b1中,从恶意代码的反汇编asm文件中提取恶意代码操作码序列,具体包括以下步骤:

5.根据权利要求3所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤s1b3中,根据计算马尔可夫转移概率矩阵,生成马尔可夫图像,具体包括以下步骤:

6.根据权利要求1所述的一种面向恶意代码图像的可解释性评估方法,其特征在于,步骤s...

【专利技术属性】
技术研发人员:吴绿滨蔡忠武刘延华李嘉琪沈婷招
申请(专利权)人:福建福海创石油化工有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1