一种基于机器学习和群智能算法的恶意代码分类方法技术

技术编号:45013572 阅读:22 留言:0更新日期:2025-04-18 16:58
本发明专利技术属于恶意代码检测领域,提供了一种基于机器学习和群智能算法的恶意代码分类方法,此方法包括以下步骤:S1、数据预处理;S2、特征融合与选择;S3、模型训练与分类;本发明专利技术通过融合不同n值的n‑gram特征进行恶意代码分类,和基于单一n值的分类方法相比,准确率、精确率、召回率和F1‑score四项指标均有提高,通过采用改进的离散二进制粒子群算法对融合后的特征进行进一步选择,在提高分类精度的同时,大幅减少了特征量,提高了模型运行速度。

【技术实现步骤摘要】

本专利技术属于恶意代码检测领域,具体地说是一种基于机器学习和群智能算法的恶意代码分类方法


技术介绍

1、近年来,随着人工智能技术的发展,机器学习已经成为恶意代码检测的一种重要方法。在恶意代码特征选取方面,操作码n-gram特征是经常用到的特征之一;有学者提出基于操作码序列共现频率及其相关性的恶意软件分类方法,从恶意软件操作码序列中提取2-gram特征,采用信息增益算法选择前1000个作为最具有区分性的特征,用支持向量机进行恶意代码分类;有学者提取操作码4-gram特征,使用人工神经网络、支持向量机、贝叶斯网和随机森林等多种有监督和无监督的机器学习方法,对恶意软件和良性文件进行区分;有学者提出基于pe字节的勒索软件检测方案,利用增益比确定文件中更有效区分勒索软件和良性文件的上千种4-gram组合,将这1000多个4-gram组合视为特征向量,用随机森林进行分类;有学者采用n-gram算法提取恶意软件操作码特征和api调用特征,恶意样本的最终标签由基于api和基于操作码的检测器的最高概率决定;也有学者利用操作码类别序列和熵值来创建特征,在5-nn、svm和随本文档来自技高网...

【技术保护点】

1.一种基于机器学习和群智能算法的恶意代码分类方法,其特征在于:包括以下步骤:

2.如权利要求1所述一种基于机器学习和群智能算法的恶意代码分类方法,其特征在于:在步骤S1中,所述数据预处理环节具体步骤如下:

3.如权利要求1所述一种基于机器学习和群智能算法的恶意代码分类方法,其特征在于:在步骤S2中,所述特征融合的具体步骤如下:

4.如权利要求1所述一种基于机器学习和群智能算法的恶意代码分类方法,其特征在于:在步骤S2中,所述融合后的特征采用改进的粒子群算法进一步进行筛选,只保留其中的关键特征,所述粒子群算法具体步骤如下:

<p>5.如权利要求1...

【技术特征摘要】

1.一种基于机器学习和群智能算法的恶意代码分类方法,其特征在于:包括以下步骤:

2.如权利要求1所述一种基于机器学习和群智能算法的恶意代码分类方法,其特征在于:在步骤s1中,所述数据预处理环节具体步骤如下:

3.如权利要求1所述一种基于机器学习和群智能算法的恶意代码分类方法,其特征在于:在步骤s2中,所述特征融合的具体步骤如下:

4.如...

【专利技术属性】
技术研发人员:刘强王坚王艺菲杨春晓孙文宋亚飞王莹莹徐云飞张春梅王芝
申请(专利权)人:中国人民解放军空军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1