一种基于深度学习的勒索软件检测技术制造技术

技术编号：20160900 阅读：56 留言：0更新日期：2019-01-19 00:13

本发明专利技术运用深度学习的分析方法对勒索软件进行检测和防范。通过静态和动态特征相结合的方式来描述勒索软件的特征。首先通过n‑gram分别提取操作码序列和文件行为序列作为静态和动态特征，然后使用加权信息增益算法选择合适的特征序列，最后将其作为深度置信网络的输入向量进行模型训练。提出了采用深度置信网络模型来检测勒索软件，深度置信网络是半监督学习，可以采用大量未标注的样本进行训练，能够更好的学习勒索软件的特征，达到更好的检测效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的勒索软件检测技术
本专利技术运用深度置信网络的方法来对勒索软件进行检测和防范。通过研究勒索软件的主要特征，并针对当前检测方法的局限性，提出了一种基于深度置信网络的勒索软件检测方法，通过提取勒索软件的静态和动态特征对其进行检测。
技术介绍
传统的静态分析在特征提取和分析速度上更加方便、灵活，但是其容易被一些对抗技术如加壳、压缩等来绕过；动态分析相比于静态分析有更高的检测率，但是动态分析容易受到运行环境的影响，不能够保证样本在运行时能够表现出其特征。深度学习属于机器学习的一个分支。在深度学习诞生以前，基于统计模型的机器学习方法已经在各个领域都取得了巨大的成就，如随机森林模型，贝叶斯方法模型，支持向量机等等。可以将这些机器学习模型看成是带有一层隐藏节点或者是没有隐藏节点的人工神经网络，这些模型对多维特征的处理往往具有一定的局限性，容易造成“维度爆炸”。浅层模型处理规模较大且复杂的数据集的能力有限，同时也会出现很多难以回避的问题，如梯度消失，其原因在于反向传播阶段，误差会随层数的增加而呈指数级趋势减少，传递到最初几层网络时对网络影响很小，导致最初几层的网...

【技术保护点】
1.一种基于深度置信网络的勒索软件检测模型，其特征在于，所述方法包括如下步骤：A、勒索软件静态特征的提取，将文件操作码序列作为其静态特征，输入：二进制程序集合G，输出：操作码序列集合S；B、勒索软件动态特征的提取，将文件行为序列作为其动态特征，输入：二进制程序集合G输出：文件行为序列集合S；C、基于深度置信网络模型，输入：文件操作码序列特征和文件行为序列特征G，输出：参数调节后达到最佳分类效果的深度置信网络模型。

【技术特征摘要】
1.一种基于深度置信网络的勒索软件检测模型，其特征在于，所述方法包括如下步骤：A、勒索软件静态特征的提取，将文件操作码序列作为其静态特征，输入：二进制程序集合G，输出：操作码序列集合S；B、勒索软件动态特征的提取，将文件行为序列作为其动态特征，输入：二进制程序集合G输出：文件行为序列集合S；C、基于深度置信网络模型，输入：文件操作码序列特征和文件行为序列特征G，输出：参数调节后达到最佳分类效果的深度置信网络模型。2.根据权利要求1所述的一种基于基于深度置信网络模型，其特征在于，所述的步骤逐层预训练RBM的过程A进一步包括如下步骤：A1、初始化深度置信网络模型的各项参数；A2、根据公式，计算hi(t)~P(hi|v(t))A3、根据公式，计算hj(t+1)~P(vj|h(t))A4、通过对比散度算法，实现可见层的重构，并通过样本输入与重构输出之间的误差，采用梯度下降法对参数向量进行更新：。3.根据权利要求1...

【专利技术属性】
技术研发人员：方勇，刘亮，张磊，陈政，羊少帅，
申请(专利权)人：四川大学，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人