【技术实现步骤摘要】
基于深度强化学习的安卓恶意软件检测特征提取方法
[0001]本专利技术涉及软件与信息系统安全
,确切地说涉及一种基于深度强化学习的安卓恶意软件检测特征提取方法。
技术介绍
[0002]随着新一代网络信息技术的不断发展,越来越多的人开始使用互联网,互联网开始影响着生活的方方面面,然而,互联网的发展也加速了恶意软件的传播,恶意软件是指实现了攻击者恶意目的的软件,经常通过互联网传播,是存在损害用户利益的行为是判定软件是否为恶意软件的依据。
[0003]而随智能手机的不断发展,越来越多的人选择使用智能手机,搭载安卓系统的智能手机始终占据了市场的很大份额,安卓系统的恶意软件能够求取用户隐私信息、获取用户利益、远程控制达到非法个人目的。自2013年以来,安卓操作系统一直占据着移动操作系统市场的统治地位,这个平台的开源性和开放性是的安卓平台成为恶意软件攻击的热门目标。根据Trend Force最新发布数据,2020年智能手机的总产量为12.5亿部,Android占据了78.4%的市场份额。然而,由于广泛分布和开源特性,除了官方Android Market之外,Android应用程序还可以从未知、不受信任和潜在恶意的第三方下载和安装,这使得该平台成为恶意软件攻击的目标。根据360安全于2020年2月28日发布的2019年Android恶意软件专项报告显示,2019年该平台在移动端拦截新恶意软件样本约180.9万个,平均每天拦截约5000个新移动恶意软件样本,因此,对于恶意安卓软件的分析研究刻不容缓。
[0004 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的安卓恶意软件检测特征提取方法,其特征在于:包括样本获取步骤、深度强化学习模型构建步骤以及模型训练步骤;样本获取步骤,从Android平台的Androzoo以及Drebin数据集中获取若干不同的良性和恶意的APK样本,并通过所述APK样本进行对特征提取和特征向量化处理得到样本集合;深度强化学习模型构建步骤,选择Double Deep Q
‑
Learning算法作为深度强化学习模型,选定基于机器学习算法的、用于检测恶意安卓软件的分类器模型,并定义所述深度强化学习模型的学习动作空间与状态空间,设定奖励机制,并初始化所述深度强化学习模型以及其决策网络的超参数;模型训练步骤,启动所述深度强化学习模型进行学习训练,训练过程中损失深度强化学习模型按照设定数量从其经验回放池中选取学习经验更新其决策网络,当深度强化学习模型观测到在探索模式下和利用模式下选择的特征达到设定数量后结束当前轮次的训练,然后根据设定的训练轮次循环对深度强化学习模型进行学习训练,完成全部轮次的训练后,将识别准确率最高的特征子集作为最终选取的最优特征子集。2.如权利要求1所述的基于深度强化学习的安卓恶意软件检测特征提取方法,其特征在于:所述样本获取步骤中,获取APK样本后还需对其进行数据清洗,具体的,是通过Androguard工具对所述APK样本进行解析,同时通过APKTool工具对所述APK样本进行反汇编,删除解析失败和反汇编失败的样本。3.如权利要求2所述的基于深度强化学习的安卓恶意软件检测特征提取方法,其特征在于:所述样本获取步骤中,所述特征提取,是通过AndroidManifest.xml文件提取出经过数据清洗后的APK样本的457个重要权限特征和126个意图特征,同时根据反汇编生成的smail格式文件语法特征,将APK样本中Method字段基本块所包含的Dalvik字节码指令按照设定的转换规则进行转换,然后使用N
‑
gram技术获取样本的N
‑
gram特征集合,含500个N
‑
gram特征。原始特征集合共1083个特征。4.如权利要求3所述的基于深度强化学习的安卓恶意软件检测特征提取方法,其特征在于:所述样本获取步骤中,特征向量化处理,是将所述APK样本采用二进制特征向量进行表示,向量中“1”表示权限特征、意图特征或N
‑
gram特征在APK文件中存在,“0”则表示APK文件中不存在权限特征、意图特征和/或N
‑
gram特征。5.如权利要求1所述的基于深度强化学习的安...
【专利技术属性】
技术研发人员:方智阳,李美瑾,曾琪,杨涛,伍胤玮,程露玉,
申请(专利权)人:四川大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。