基于行为语义融合萃取的物联网恶意代码检测方法技术

技术编号:30403601 阅读:60 留言:0更新日期:2021-10-20 10:56
本发明专利技术公开了一种基于行为语义融合萃取的物联网恶意代码检测方法,包括以下步骤:利用静态分析,对elf格式的良性与恶性代码进行反汇编,选取最合适的代码段,并提取出该段落包含的操作码;清洗样本数据,并将其融合成一个语料库和带有词频的字典,使用语料库训练word2vec的CBOW模型,采用MEOI-TFIDF算法以及MT-TextRank算法提取关键词,送入到训练好的word2vec模型里,生成词向量;使用基于注意力机制的TextCNN网络进行特征训练与分类,根据结果进行调参优化。本发明专利技术能准确识别物联网软件的二分类,并提高了样本分类的准确性。并提高了样本分类的准确性。并提高了样本分类的准确性。

【技术实现步骤摘要】
基于行为语义融合萃取的物联网恶意代码检测方法


[0001]本专利技术涉及信息安全
,尤其是一种基于行为语义融合萃取的物联网恶意代码检测方法。

技术介绍

[0002]随着信息化和通讯技术的发展,数字化经济催生的物联网系统迅猛发展,近年来物联网设备呈指数型增长,据分析公司Gartner统计指出,2020年全球物联网将超过260 亿部,5年后该数字将达到750亿部,其应用将遍布各行各业,设计生产生活的方方面面,智能家居、智慧城市、智慧医疗、智慧交通、智慧金融等将惠及大众,而恶意攻击也无时无刻的存在网络设备之间。
[0003]恶意代码分类识别也一直是互联网行业研究的重要课题,然而随着恶意代码识别技术的提高,网络攻击者所开发的恶意程序也趋向于复杂、隐秘,为了躲避安全防护工具的审查,恶意代码通常会经过变形以及混淆等手段不断形成新的变种,经典的恶意代码检测方法如特征码扫描、查找广谱特征、基于逆向工程反汇编和启发式扫描的检测技术在性能和效率上已无法应对当前恶意代码的巨大挑战。
[0004]2015年Kaggle针对恶意代码分类发起了竞赛,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于行为语义融合萃取的物联网恶意代码检测方法,其特征在于,包括:对恶意代码软件与elf格式的良性软件进行反汇编;提取汇编代码中代码段包含的关键词;将关键词样本转换为矩阵,使用卷积神经网络进行特征训练、分类。2.根据权利要求1所述的基于行为语义融合萃取的物联网恶意代码检测方法,其特征在于,所述的恶意代码软件与elf格式的良性软件,是从VirusTotal hreat Intelligence网站爬取的恶意样本与物联网应用程序中提取的良性样本。3.根据权利要求1或2所述的基于行为语义融合萃取的物联网恶意代码检测方法,其特征在于,所述的提取汇编代码中代码段包含的关键词,具体步骤如下:截取反汇编后的样本中的代码段;提取代码段包含的所有操作码;对操作码样本进行数据清洗,删除所有的标点符号以及undefined;针对清洗后的样本,使用行为语义融合萃取的方法,提取关键词。4.根据权利要求3所述的基于行为语义融合萃取的物联网恶意代码检测方法,其特征在于,所述的行为语义融合萃取方法包括以下步骤:基于MEOI-TFIDF算法的关键词提取,即将TF-IDF与平均信息熵相结合计算单个样本中操作码的权重,公式为:其中对于特征项c,n
c
为单个样本中的词频,S
c
为同一类样本中的词频数,N为样本总数,N
c
为包含特征项c的样本数,f
ck
表示词c在文档k中出现的频次;对权重W进行倒叙排序,得到最重要的M个操作码,作为单个样本的关键词;基于MT...

【专利技术属性】
技术研发人员:王娟娟刘伟伟
申请(专利权)人:南京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1