Android恶意应用检测方法技术

技术编号：39287229 阅读：5 留言：0更新日期：2023-11-07 10:57

本发明专利技术涉及Android恶意软件检测领域，特别是涉及一种Android恶意应用检测方法。从待检测应用中提取静态特征向量；基于所述静态特征向量，利用预先训练好的静态检测模型中的基学习器，对所述待检测应用进行初步预测，得到静态初步预测值；所述静态初步预测值用于表征所述待检测应用经静态检测初步确定为恶意应用的概率；基于所述静态初步预测值，利用预先训练好的静态检测模型中的元学习器，对所述待检测应用进行再预测，得到静态检测预测值；所述静态检测预测值用于表征所述待检测应用经静态检测再次确定为恶意应用的概率；根据所述静态检测预测值，确定所述待检测应用是否为恶意应用。意应用。意应用。

全部详细技术资料下载

【技术实现步骤摘要】
Android恶意应用检测方法

[0001]本申请涉及Android恶意软件检测领域，尤其是涉及一种Android恶意应用检测方法。

技术介绍

[0002]随着移动互联网的发展，Android智能手机已迅速成为流行的计算平台，用户往往会安装多种多样的应用进行使用。在此过程中，可能会无意间安装一些恶意应用，窃取用户信息或暗自执行某些操作，给Android用户带来巨大的安全隐患。
[0003]为了排查这些恶意应用，现有技术大多采用机器学习的方式对应用的恶意性进行分析预测。一般会提取待检测应用的特征，输入单一的机器学习模型中进行预测。
[0004]但是，单一的学习模型对于噪音和误差较为敏感。这些噪音和误差一般来源于训练过程中所使用的训练样本、选择的特征、模型本身特性等多方面。以训练样本为例，训练样本的数量较少、样本类型丰富度较差，可能导致训练好的模型仅对部分与训练样本对应类型的应用有较高的检测精度，而对其它类型的引用却不敏感，从而表现为鲁棒性和泛化能力都比较差，容易出现过拟合的问题。类似的，特征的选择有偏差、模型的适用场景有局限也都会引发类似的问题。可见，这种依赖于单一学习模型的检测方式的检测准确率十分依赖于训练样本的数量、样本类型丰富度、特征选择、模型性能，导致这种检测方式的准确率较低。

技术实现思路

[0005]本申请提供一种Android恶意应用检测方法，以解决上述的问题。
[0006]第一方面，本申请提供一种Android恶意应用检测方法，包括：从待检测应用中提取静态特征向量...

【技术保护点】

【技术特征摘要】
1.一种Android恶意应用检测方法，其特征在于，包括：从待检测应用中提取静态特征向量；基于所述静态特征向量，利用预先训练好的静态检测模型中的基学习器，对所述待检测应用进行初步预测，得到静态初步预测值；所述静态初步预测值用于表征所述待检测应用经静态检测初步确定为恶意应用的概率；基于所述静态初步预测值，利用预先训练好的静态检测模型中的元学习器，对所述待检测应用进行再预测，得到静态检测预测值；所述静态检测预测值用于表征所述待检测应用经静态检测再次确定为恶意应用的概率；根据所述静态检测预测值，确定所述待检测应用的静态检测结果；根据所述静态检测结果，确定所述待检测应用是否为恶意应用。2.根据权利要求1所述的方法，其特征在于，还包括：根据所述静态检测预测值，通过确定度计算公式，计算出所述静态检测结果的确定度；所述根据所述静态检测结果，确定所述待检测应用是否为恶意应用，包括：若所述静态检测结果的确定度超过静态检测确定度阈值，根据所述静态检测结果，确定所述待检测应用是否为恶意应用；否则，对所述待检测应用执行动态检测，得到动态检测结果；根据所述动态检测结果，确定所述待检测应用是否为恶意应用。3.根据权利要求2所述的方法，其特征在于，所述对所述待检测应用执行动态检测，得到动态检测结果，包括：从所述待检测应用的模拟运行数据中提取动态特征向量；基于所述动态特征向量，利用预先训练好的动态检测模型中的基学习器，对所述待检测应用进行初步预测，得到动态初步预测值；所述动态初步预测值用于表征所述待检测应用经动态检测初步确定为恶意应用的概率；基于所述动态初步预测值，利用预先训练好的动态检测模型中的元学习器，对所述待检测应用进行再预测，得到动态检测预测值；所述动态检测预测值用于表征所述待检测应用经动态检测再次确定为恶意应用的概率；根据所述动态检测预测值，确定所述待检测应用的动态检测结果。4.根据权利要求1
‑
3任一项所述的方法，其特征在于，还包括：基于支持向量机算法、随机森林算法、XGBoost算法构建所述基学习器；基于GBDT算法，构建所述元学习器。5.根据权利要求1所述的方法，其特征在于，所述从待检测应用中提取静态特征向量,包括：对所述待检测应用进行反编译，得到源码信息；从所述源码信息中抽取dalvik字节码特征；根据Dalvik转换表将所述dalvik字节码特征转换成Opcode序列特征；使用N
‑
gram技术将所述Opcode序列特征切分成Opcode N
‑
gram特征集合，得到Opcode N

【专利技术属性】
技术研发人员：刘全明，薛文鹏，马超，杨茹贤，任国超，
申请(专利权)人：山西晋信安科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人