恶意软件检测器训练方法、检测器、电子设备及存储介质技术

技术编号：33731171 阅读：13 留言：0更新日期：2022-06-08 21:26

本发明专利技术公开了一种恶意软件检测器训练方法、检测器、电子设备及存储介质。恶意软件检测器训练方法包括：获取原始样本数据集，并得到原始样本数据集的原始恶意软件检测率；获取每个原始样本的特征参数，特征参数用于表征原始样本为恶意软件的不确定程度；根据特征参数，从原始样本数据集中选择占总样本比例为α的代表样本数据集，并得到代表样本数据集的恶意软件检测率，其中，α大于0且小于1，恶意软件检测率与原始恶意软件检测率的差值在第一预设范围内；将代表样本数据集输入预设训练模型进行训练，得到恶意软件检测器。本发明专利技术提供的恶意软件检测器训练方法能够在降低模型训练难度的同时，确保训练后模型的准确率。确保训练后模型的准确率。确保训练后模型的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
恶意软件检测器训练方法、检测器、电子设备及存储介质

[0001]本专利技术涉及软件安全
，尤其涉及一种恶意软件检测器训练方法、检测器、电子设备及存储介质。

技术介绍

[0002]目前，数量庞大的恶意软件对安卓系统安全和用户权益构成了极大威胁。因此，研究安卓恶意软件检测方法是移动端操作系统安全防护领域的重要内容之一。
[0003]可解释性安卓恶意软件检测方法主要为基于规则的安卓恶意软件检测方法，该方法主要是提取出获取恶意软件频繁请求但良性软件很少请求的权限，以此作为检测安卓恶意软件的规则，再利用该规则集检测恶意软件。
[0004]然而，专利技术人发现：基于规则的安卓恶意软件检测方法能够体现特征与检测结果之间的因果关系，但该方法建立在大量人工分析的基础上，模型的训练难度高。

技术实现思路

[0005]本专利技术提供了一种恶意软件检测器训练方法、检测器、电子设备及存储介质，其能够在降低模型训练难度的同时，确保训练后模型的准确率。
[0006]根据本专利技术的一方面，提供了一种恶意软件检测器训练方法，包括：获取原始样本数据集，并得到所述原始样本数据集的原始恶意软件检测率，其中，所述原始样本数据集中包括多个原始样本；获取每个所述原始样本的特征参数，所述特征参数用于表征所述原始样本为恶意软件的不确定程度；根据所述特征参数，从所述原始样本数据集中选择占总样本比例为α的代表样本数据集，并得到所述代表样本数据集的恶意软件检测率，其中，α大于0且小于1，所述恶意软件检测率与所述原始恶意软件检...

【技术保护点】

【技术特征摘要】
1.一种恶意软件检测器训练方法，其特征在于，包括：获取原始样本数据集，并得到所述原始样本数据集的原始恶意软件检测率，其中，所述原始样本数据集中包括多个原始样本；获取每个所述原始样本的特征参数，所述特征参数用于表征所述原始样本为恶意软件的不确定程度；根据所述特征参数，从所述原始样本数据集中选择占总样本比例为α的代表样本数据集，并得到所述代表样本数据集的恶意软件检测率，其中，α大于0且小于1，所述恶意软件检测率与所述原始恶意软件检测率的差值在第一预设范围内；将所述代表样本数据集输入预设训练模型进行训练，得到恶意软件检测器。2.根据权利要求1所述的恶意软件检测器训练方法，其特征在于，所述特征参数为信息熵；所述获取每个所述原始样本的特征参数，包括：将多个所述原始样本输入预设训练分类器，得到每个所述原始样本被分类为恶意软件或良性软件的概率；根据以下公式得到所述信息熵：其中，n为原始样本数量，i为原始样本序号，p(y
i
)为原始样本被分类为恶意软件或良性软件的概率，H(Y)为所述信息熵。3.根据权利要求1所述的恶意软件检测器训练方法，其特征在于，所述根据所述特征参数，从所述原始样本数据集中选择占总样本比例为α的代表样本数据集，包括：根据所述信息熵的大小对所述原始样本数据集中的多个原始样本进行降序排列；选择所述多个原始样本中信息熵最大、且占总样本比例为α的样本作为所述代表样本数据集。4.根据权利要求1
‑
3中任一项所述的恶意软件检测器训练方法，其特征在于，在得到所述代表样本数据集的恶意软件检测率之后，还包括：判断所述恶意软件检测率与所述原始恶意软件检测率的差值是否在所述第一预设范围内；在判定在所述第一预设范围内时，再执行所述将所述代表样本数据集输入预设训练模型；在判定不在所述第一预设范围内时，调整α的大小，得到新的恶意软件检测率，直至所述新的恶意软件检测率与所述原始恶意软件检测率的差值在所述第一预设范围内。5.根据权利要求1所述的恶意软件检测器训练方法，其特征在于，所述将所述代表样本数据集输入预设训练模型进行训练，得到恶意软件检测器，包括：将所述代表样本数据集输入基于AdaBoost算法的检测模型，提取初始检测规则，其中，所述初始检测规则为由多个逻辑连接字连接的特征表达式；去除每个所述初始检测规则中多余的逻辑连接字，并将去除多余的逻辑连接字的初始检测规则作为精简检测...

【专利技术属性】
技术研发人员：王海州，
申请(专利权)人：中国农业银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人