盲特征场景下恶意软件对抗样本生成方法与电子设备技术

技术编号:39330205 阅读:8 留言:0更新日期:2023-11-12 16:06
本发明专利技术公开了一种盲特征场景下恶意软件对抗样本生成方法与电子设备,属于恶意软件识别技术领域,所述对抗样本生成方法包括:将待扰动的恶意软件输入多异构智能体协同网络,每个智能体负责一类特征的决策;整合所有智能体的决策,向恶意软件中新增特征元素作为干扰,并将添加干扰后的软件送入检测系统进行检测,若检测为良性软件,说明干扰有效,得到恶意软件对抗样本,若检测为恶意软件,说明干扰无效,则计算每个智能体的际贡献作为其奖励值,送入评价网络更新网络参数并执行智能体新一轮的迭代,直至输出对抗样本。本发明专利技术通过多个智能体集中训练、分布执行,并结合特定的奖励规则,可以大大提高训练速度,快速生成黑盒盲特征场景下的对抗样本。景下的对抗样本。景下的对抗样本。

【技术实现步骤摘要】
盲特征场景下恶意软件对抗样本生成方法与电子设备


[0001]本专利技术属于恶意软件识别
,更具体地,涉及一种盲特征场景下恶意软件对抗样本生成方法与电子设备。

技术介绍

[0002]在各平台的应用商城中包含大量的应用软件,软件提供方将应用软件上传至平台时,平台会提前利用检测系统识别软件是否安全,若为恶意软件,将拒绝添加该应用软件。目前,检测系统一般基于机器学习进行分类,该方法大大提高了恶意软件的识别能力。然而,现有研究表明机器学习在安全敏感系统中容易受到对抗样本攻击,攻击者通过对恶意软件添加扰动,有可能使检测系统将恶意软件误识别为良性软件而通过检测,这些能使检测系统误判的扰动样本称之为对抗样本。而检测系统中任何漏洞都会对其所保护的平台造成极大的威胁。因此,需要了解攻击者可能输入的对抗样本,在对检测系统进行分类训练时,在训练样本中加入对抗样本,可以提高检测系统的鲁棒性。
[0003]目前,恶意软件对抗样本生成算法都是安全公司在已知恶意软件检测系统特征提取方式、模型参数、学习算法的理想情况下进行的,即假设攻击者对检测系统具有完全知识或者部分知识,这些假设是不切实际的。而现实场景下,在真实场景下,攻击者大多对于目标检测系统是零知识的,安全公司等机构将恶意软件检测系统部署在云端,对于攻击者而言,只能通过上传自己的软件,然后检测系统给攻击者返回检测报告,攻击者对检测系统内部的特征提取方式是无法获取的。为切实真实世界应用场景,更好地提升检测系统的鲁棒性,需要提出一种未知软件检测系统分类方式的黑盒盲特征场景下的恶意软件对抗样本生成方法。

技术实现思路

[0004]针对现有技术的以上缺陷或改进需求,本专利技术提供了一种盲特征场景下恶意软件对抗样本生成方法与电子设备,其目的在于提出一种未知软件检测系统分类方式的黑盒盲特征场景下的恶意软件对抗样本生成方法,可以快速生成切实真实世界应用场景的对抗样本,以用于提升检测系统的鲁棒性。
[0005]为实现上述目的,按照本专利技术的一个方面,提供了一种盲特征场景下恶意软件对抗样本生成方法,包括:步骤S1:将待扰动的恶意软件输入多异构智能体协同网络,所述多异构智能体协同网络包含N个智能体,每个智能体具有独立的策略网络和价值网络,第i个智能体负责软件文件中第i类特征的决策,i=1,2,
……
,N,N为软件文件中待决策特征的种类数量;步骤S2:将第i类特征的特征元素集合L
i
中各特征元素在当前时刻的状态输入第i个智能体策略网络进行决策,得到集合中每个特征元素被选择执行动作的概率;再基于各特征元素的概率随机改变一个特征元素的状态作为在时刻的执行动作,状态更新为时刻的状态;
步骤S3:基于所有智能体更新的状态对输入的恶意软件新增特征元素作为扰动,得到时刻更新的恶意软件,利用检测系统对更新的恶意软件进行检测,若检测为恶意软件,则执行步骤S4;若检测为良性软件,则跳转至步骤S6;步骤S4:计算第i个智能体策略网络执行动后的奖励,组成样本对,奖励为第i个智能体在时刻不执行动作与执行动作两种情况下检测系统判定训练样本为恶意软件的置信度的差值;步骤S5:基于所有策略网络的样本对更新每个智能体的价值网络参数以及策略网络参数;以,跳转至步骤S2;步骤S6:输出更新的恶意软件作为对抗样本。
[0006]在其中一个实施例中,第i类特征的特征元素集合L
i
以良性软件中第i类特征所用特征元素构成第i类特征的良性特征元素集合。
[0007]在其中一个实施例中,确定第i类特征的良性特征元素集合的过程包括:获取待扰动的恶意软件的恶意融合特征,选择多个良性软件并获取每个良性软件的良性融合特征,每个融合特征均为从对应的软件文件中所提取的N类特征进行融合而成;分别计算恶意融合特征和每个良性融合特征的相似度,以相似度最高的良性软件中第i类特征所用特征元素构成第i类特征的良性特征元素集合L
i

[0008]在其中一个实施例中,获取每个融合特征的过程包括:通过N个训练好的特征提取网络分别从对应的软件文件提取N类特征,每个特征提取网络输出对应种类特征的特征向量;将N个特征向量进行拼接融合,得到对应软件文件的融合特征。
[0009]在其中一个实施例中,计算恶意融合特征和每个良性融合特征的相似度,具体为计算恶意融合特征和每个良性融合特征的余弦相似度。
[0010]在其中一个实施例中,良性软件和恶意软件均为安卓软件,软件文件中待决策特征的种类包括权限特征、组件特征、意图特征、敏感应用程序接口特征和函数调用特征。
[0011]在其中一个实施例中,权限特征、组件特征、意图特征、敏感应用程序接口特征中每类特征的特征元素集合为一维向量模式,特征元素集合中的每个特征元素为一维向量中的向量元素,每个特征元素具有两个状态值,其中一个状态值表示特征元素被选择加入软件文件,另一个状态值表示特征元素未被选择加入软件文件;函数调用特征的特征元素集合为调用关系图模式,调用关系图具有节点和节点之间的连接边,其中,每个节点表示一个函数,两节点通过连接边连接表示两个函数之间存在调度关系,特征元素集合中的每个特征元素为调用关系图中的连接边,每个特征元素具有两个状态值,其中一个状态值表示连接边被选择加入软件文件,另一个状态值表示连接边未被选择加入软件文件。
[0012]在其中一个实施例中,在步骤S3中,当需要针对函数调用特征新增从函数A到函数B的连接边作为扰动时,对恶意软件中的原始的函数A进行修改,修改方式包括:在函数A中添加对函数B的调用关系,且在函数A中设置长度不满足设定条件的可变形参args,以可变形参args作为执行从函数A到函数B的判断条件,只有可变形参args的长度满足设定条件
时,函数A才会执行对函数B的调用,否则,不执行调用。
[0013]按照本专利技术的另一方面,提供了一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
[0014]按照本专利技术的另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
[0015]总体而言,通过本专利技术所构思的以上技术方案与现有技术相比,能够取得下列有益效果:本专利技术选择包含N个智能体的多异构智能体协同网络作为对抗样本的主体生成结构,通过集中式训练、分布式执行的方式,可以快速生成盲特征场景下的对抗样本。由于软件文件中包含非常多种类的特征,而检测系统的检测算法也多种多样,不同的检测算法根据不同种类的特征实现分类识别。在攻击者未知检测系统的检测算法的黑盒盲特征场景下,并不知道应该对哪些种类的特征添加扰动。若是添加扰动的特征种类并非检测软件进行分类所依据的特征种类,所添加的扰动是无效的,无法生成对抗样本。若是对所有种类的所有特征元素进行遍历搜索,将面临巨大的搜索空间,造成算法难以收敛或者收敛速度极慢,在效率和性能上会存在巨大挑战。在本专利技术中,多异构智能体协同网络包含N个智能体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种盲特征场景下恶意软件对抗样本生成方法,其特征在于,包括:步骤S1:将待扰动的恶意软件输入多异构智能体协同网络,所述多异构智能体协同网络包含N个智能体,每个智能体具有独立的策略网络和价值网络,第i个智能体负责软件文件中第i类特征的决策,i=1,2,
……
,N,N为软件文件中待决策特征的种类数量;步骤S2:将第i类特征的特征元素集合L
i
中各特征元素在当前时刻的状态输入第i个智能体策略网络进行决策,得到集合中每个特征元素被选择执行动作的概率;再基于各特征元素的概率随机改变一个特征元素的状态作为在时刻的执行动作,状态更新为时刻的状态;步骤S3:基于所有智能体更新的状态对输入的恶意软件新增特征元素作为扰动,得到时刻更新的恶意软件,利用检测系统对更新的恶意软件进行检测,若检测为恶意软件,则执行步骤S4;若检测为良性软件,则跳转至步骤S6;步骤S4:计算第i个智能体策略网络执行动后的奖励,组成样本对,奖励为第i个智能体在时刻不执行动作与执行动作两种情况下检测系统判定训练样本为恶意软件的置信度的差值;步骤S5:基于所有策略网络的样本对更新每个智能体的价值网络参数以及策略网络参数;以,跳转至步骤S2;步骤S6:输出更新的恶意软件作为对抗样本。2.如权利要求1所述的盲特征场景下恶意软件对抗样本生成方法,其特征在于,第i类特征的特征元素集合L
i
以良性软件中第i类特征所用特征元素构成第i类特征的良性特征元素集合。3.如权利要求2所述的盲特征场景下恶意软件对抗样本生成方法,其特征在于,确定第i类特征的良性特征元素集合的过程包括:获取待扰动的恶意软件的恶意融合特征,选择多个良性软件并获取每个良性软件的良性融合特征,每个融合特征均为从对应的软件文件中所提取的N类特征进行融合而成;分别计算恶意融合特征和每个良性融合特征的相似度,以相似度最高的良性软件中第i类特征所用特征元素构成第i类特征的良性特征元素集合L
i
。4.如权利要求3所述的盲特征场景下恶意软件对抗样本生成方法,其特征在于,获取每个融合特征的过程包括:通过N个训练好的特征提取网络分别从对应的软件文件提取N类特...

【专利技术属性】
技术研发人员:袁巍吴棒李珩龚柱
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1