一种基于恶意行为增强预训练模型的恶意软件检测方法技术

技术编号:39593915 阅读:25 留言:0更新日期:2023-12-03 19:49
本发明专利技术公开了一种基于恶意行为增强预训练模型的恶意软件检测方法,该方法首先从

【技术实现步骤摘要】
一种基于恶意行为增强预训练模型的恶意软件检测方法


[0001]本专利技术涉及软件安全防护
,具体涉及一种基于预训练模型的恶意软件检测方法


技术介绍

[0002]随着互联网的快速发展,恶意软件的数量和变种也呈现出爆炸式的增长趋势

据德国安全技术公司
AV

TEST
的数据统计,截至
2023
年7月,恶意软件的数量超过九亿,其中
Windows
平台的恶意软件占比超过
75


由于
Windows
操作系统广泛应用于各个领域,恶意软件会对用户设备

数据和资源造成严重破坏和威胁

尽管微软和软件安全公司在保护用户操作系统方面做出了巨大努力,但美国安全技术公司
McAfee
的报告显示,恶意软件的增长率并没有受到抑制,主要原因是恶意软件作者采用了更先进的反检测技术,提高了恶意软件逃逸检测的概率

因此,采用先进而有效的方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于恶意行为增强预训练模型的恶意软件检测方法,其特征在于,包括以下步骤:步骤1,从
API
调用序列数据集中提取
API
调用序列;步骤2,将所有
API
调用序列构成语料库,并根据统计规则生成反映软件恶意行为的
API
元组集合;步骤3,使用公开数据集预训练恶意软件检测模型,接着使用无标签
API
调用序列做继续预训练;步骤4,使用有标签
API
调用序列对恶意软件检测模型进行微调,并经过线性降维实现二分类,完成恶意软件的检测
。2.
根据权利要求1所述的一种基于恶意行为增强预训练模型的恶意软件检测方法,其特征在于,步骤1中所述
API
调用序列数据集为:将真实样本软件在沙箱中运行提取出的
API
调用序列构成的集合,其中包含用于恶意软件检测模型预训练的无标签
API
调用序列集合及用于微调的有标签
API
调用序列集合
。3.
根据权利要求2所述的一种基于恶意行为增强预训练模型的恶意软件检测方法,其特征在于,步骤2中所述根据统计规则生成反映软件恶意行为的
API
元组集合的具体过程如下:
2.1、
将所有
API
调用序列划分成二元组;
2.2、
定义
TF
代表一个元组在恶意软件中出现的频率:
TF

TN
m
/MTN
,其中
TN
m
代表某个元组在恶意软件中出现的次数,
MTN
是恶意软件总元组数;定义
TW

(TN
m
/TN
α
ll
)*K
,其中
TN
α
ll
表示某个元组出现的总次数,
K
为参数;
2.3、
定义
TF

TW
值为
TF
×
TW
,将
TF

TW
值由大到小排序,提取出
TF

TW
前5%的值作为反映软件恶意行为的
API
元组集合
。4.
根据权利要求3所述的一种基于恶意行为增强预训练模型的恶意软件检测方法,其特征在于,在步骤3和步骤4中,所述的无标签
API
调用序列是指:将
API
调用序列数据集中未知行为性质的软件在沙箱中提取出的
API
调用序列;所述的有标签
API
调用序列是指:将
API
...

【专利技术属性】
技术研发人员:吴志杰寇亮
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1