基于深度强化学习的安卓恶意软件检测特征提取方法技术

技术编号：33528056 阅读：31 留言：0更新日期：2022-05-19 01:53

本发明专利技术公开了一种基于深度强化学习的安卓恶意软件检测特征提取方法，涉及软件与信息系统安全技术领域，包括样本获取步骤、深度强化学习模型构建步骤以及模型训练步骤，用于在使用机器学习方法检测安卓恶意软件时对输入特征进行降维，利用Double Deep Q

全部详细技术资料下载

【技术实现步骤摘要】
基于深度强化学习的安卓恶意软件检测特征提取方法

[0001]本专利技术涉及软件与信息系统安全
，确切地说涉及一种基于深度强化学习的安卓恶意软件检测特征提取方法。

技术介绍

[0002]随着新一代网络信息技术的不断发展，越来越多的人开始使用互联网，互联网开始影响着生活的方方面面，然而，互联网的发展也加速了恶意软件的传播，恶意软件是指实现了攻击者恶意目的的软件，经常通过互联网传播，是存在损害用户利益的行为是判定软件是否为恶意软件的依据。
[0003]而随智能手机的不断发展，越来越多的人选择使用智能手机，搭载安卓系统的智能手机始终占据了市场的很大份额，安卓系统的恶意软件能够求取用户隐私信息、获取用户利益、远程控制达到非法个人目的。自2013年以来，安卓操作系统一直占据着移动操作系统市场的统治地位，这个平台的开源性和开放性是的安卓平台成为恶意软件攻击的热门目标。根据Trend Force最新发布数据，2020年智能手机的总产量为12.5亿部，Android占据了78.4％的市场份额。然而，由于广泛分布和开源特性，除了官方Android M本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的安卓恶意软件检测特征提取方法，其特征在于：包括样本获取步骤、深度强化学习模型构建步骤以及模型训练步骤；样本获取步骤，从Android平台的Androzoo以及Drebin数据集中获取若干不同的良性和恶意的APK样本，并通过所述APK样本进行对特征提取和特征向量化处理得到样本集合；深度强化学习模型构建步骤，选择Double Deep Q
‑
Learning算法作为深度强化学习模型，选定基于机器学习算法的、用于检测恶意安卓软件的分类器模型，并定义所述深度强化学习模型的学习动作空间与状态空间，设定奖励机制，并初始化所述深度强化学习模型以及其决策网络的超参数；模型训练步骤，启动所述深度强化学习模型进行学习训练，训练过程中损失深度强化学习模型按照设定数量从其经验回放池中选取学习经验更新其决策网络，当深度强化学习模型观测到在探索模式下和利用模式下选择的特征达到设定数量后结束当前轮次的训练，然后根据设定的训练轮次循环对深度强化学习模型进行学习训练，完成全部轮次的训练后，将识别准确率最高的特征子集作为最终选取的最优特征子集。2.如权利要求1所述的基于深度强化学习的安卓恶意软件检测特征提取方法，其特征在于：所述样本获取步骤中，获取APK样本后还需对其进行数据清洗，具体的，是通过Androguard工具对所述APK样本进行解析，同时通过APKTool工具对所述APK样本进行反汇编，删除解析失败和反汇编失败的样本。3.如权利要求2所述的基于深度强化学习的安卓恶意软件检测特征提取方法，其特征在于：所述样本获取步骤中，所述特征提取，是通过AndroidManifest.xml文件提取出经过数据清洗后的APK样本的457个重要权限特征和126个意图特征，同时根据反汇编生成的smail格式文件语法特征，将APK样本中Method字段基本块所包含的Dalvik字节码指令按照设定的转换规则进行转换，然后使用N
‑
gram技术获取样本的N
‑
gram特征集合，含500个N
‑
gram特征。原始特征集合共1083个特征。4.如权利要求3所述的基于深度强化学习的安卓恶意软件检测特征提取方法，其特征在于：所述样本获取步骤中，特征向量化处理，是将所述APK样本采用二进制特征向量进行表示，向量中“1”表示权限特征、意图特征或N
‑
gram特征在APK文件中存在，“0”则表示APK文件中不存在权限特征、意图特征和/或N
‑
gram特征。5.如权利要求1所述的基于深度强化学习的安...

【专利技术属性】
技术研发人员：方智阳，李美瑾，曾琪，杨涛，伍胤玮，程露玉，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人