一种融合机器学习和深度学习的恶意软件检测方法技术

技术编号：33047445 阅读：9 留言：0更新日期：2022-04-15 09:31

本发明专利技术公开了一种融合机器学习和深度学习的恶意软件检测方法，采用机器学习(LightGBM)与深度学习(1D

全部详细技术资料下载

【技术实现步骤摘要】
一种融合机器学习和深度学习的恶意软件检测方法

[0001]本专利技术涉及软件测试
，尤其涉及一种融合机器学习和深度学习的恶意软件检测方法。

技术介绍

[0002]恶意软件(Malware)泛指计算机系统上恶意执行任务的病毒、蠕虫和木马等可执行性文件，旨在通过收集敏感信息或对计算机系统进行未经授权的访问来破坏计算机系统的正常运行，恶意软件不仅可以对受到感染的电脑或设备造成影响，与受感染设备通信的其他设备也可能受到影响。
[0003]随着互联网、个人计算机和移动平台的快速普及，各种各样的恶意软件层出不穷，恶意软件市场良好，具有庞大的市场，在网络安全机制不断更新的背景下，恶意软件仍然可以给用户造成巨大的损失，近些年恶意软件检测技术的快速发展使其成为了学术界网络安全领域中的热点问题。如何快速且准确的检测到待检测的软件是否为恶意软件，是恶意软件检测中亟待解决的问题。
[0004]恶意软件检测(Malware Detection)系统是一种用来检测恶意软件、样本是否具有恶意性并对恶意进行主动防御的网络安全技术。在恶意软件检测系统中，最重要的一环是对系统内的或已提取出的待测样本进行分析并检测出可能存在的恶意软件。目前恶意软件检测系统的研究主要分为静态检测和动态检测两部分。
[0005]1)静态检测是即不运行程序对程序本身进行分析，通常直接从待测的二进制文件中通过反汇编工具对恶意程序反汇编提取所需要的静态特征作为数据进行分析，静态特征一般包括n
‑
gram比特序列、字符串特征、控制流图...

【技术保护点】

【技术特征摘要】
1.一种融合机器学习和深度学习的恶意软件检测方法，其特征在于，包括以下步骤：S1、对原始数据集进行特征降维处理和特征重要性排序筛选；S2、使用训练数据对模型进行训练和微调，得到训练完的检测模型并保存；S3、利用检测模型对测试数据进行检测，得到检测结果。2.根据权利要求1所述的融合机器学习和深度学习的恶意软件检测方法，其特征在于，步骤S1中特征重要性排序筛选的方法为：1)删除大多数缺少属性值的属性；2)删除属性值不平衡的属性；3)填充样本中属性的缺失值，选择与样本标签相同的样本集属性的众数来填充缺失值；4)特征属性量化编码：从0
‑
m对离散的特征属性进行编码，其中m表示类型总数。3.根据权利要求1所述的融合机器学习和深度学习的恶意软件检测方法，其特征在于，步骤S1中特征降维处理的方法为：通过LightGBM模型对特征进行训练进而对特征进行降维处理，并按照特征重要性和特征累计重要性对提取的特征进行top
‑
k排序并输出，作为后续恶意软件检测1D
‑
CNN神经网络模型的输入。4.根据权利要求3所述的融合机器学习和深度学习的恶意软件检测方法，其特征在于，步骤S1中数据特征由83维降到71维。5.根据权利要求3所述的融合机器学习和深度学习的恶意软件检测方法，其特征在于，步骤S1中累积重要性的设定阈值为0.95。6.根据权利要求3所述的融合机器学习和深度学习的恶意软件检测方法，其特征在于，LightGBM模型中，根据前向步算法，第m步的模型表示为：f
m
(x)＝f
m
‑1(x)+T(x，θ
m
)
ꢀꢀ
(2)式中，T(x，θ
m
)表示决策树，θ<...

【专利技术属性】
技术研发人员：李小勇，霍达，高雅丽，栗仕超，李曦明，蒋哲，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人