一种基于深度学习的恶意流量检测实现方法和装置制造方法及图纸

技术编号：19746330 阅读：42 留言：0更新日期：2018-12-12 04:55

本发明专利技术实施例公开了一种基于深度学习的恶意流量检测实现方法和装置，该方法可以包括：通过动态沙箱技术获得恶意代码的流量会话；将恶意代码的流量会话映射为基因图谱并提取图谱特征，利用流量会话的图谱特征进行聚类，并对聚类结果进行恶意代码家族标注；利用标注后的恶意代码家族的基因图谱训练预设的深度学习模型，以建立恶意流量检测模型；利用恶意流量检测模型对网络实时流量进行检测，实现恶意流量检测。通过该实施例方案，在一定程度上解决了目前的检测技术存在的人工特征提取困难、隐私泄露、加密和混淆难以识别、机器学习特征人工提取等诸多问题，并且鲁棒性较高，且具有快速、准确率高、误报率低、跨平台检测等特点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的恶意流量检测实现方法和装置
本专利技术实施例涉及计算机安全技术，尤指一种基于深度学习的恶意流量检测实现方法和装置。
技术介绍
传统的恶意(异常)流量的检测方法是使用传输层端口来识别大部分恶意(异常)流量，虽然存在不精准的问题，但依旧是连续监视和报告异常流量快速、简单的方法。之后，提出基于有效载荷的方法，通过检测包内容来识别和恶意(异常)流量相关的字节或字符串，或者进行更复杂的句法匹配。但这种方法涉及到隐私问题，同时无法应对加密、协议混淆等问题。当前，使用传统机器学习的模式识别算法，在一定程度上能够解决隐私问题，而且可以有效的应对流量混淆和流量加密。传统的机器学习方法已经解决了很多问题，但是它也面临着一个新挑战，就是如何选择合适的特征，目前仍需要人工选择合适的特征。鉴于此，现有技术有待改进和提高。
技术实现思路
为了解决上述技术问题，本专利技术实施例提供了一种基于深度学习的恶意流量检测实现方法和装置，能够在一定程度上解决目前的检测技术存在的人工特征提取困难、隐私泄露、加密和混淆难以识别、机器学习特征人工提取等诸多问题，并且鲁棒性较高，且具有快速、准确率高、误报率低、跨平台检测等特点。为了达到本专利技术实施例目的，本专利技术实施例提供了一种基于深度学习的恶意流量检测实现方法，该方法可以包括：通过动态沙箱技术获得恶意代码的流量会话；将恶意代码的流量会话映射为基因图谱并提取图谱特征，利用流量会话的图谱特征进行聚类，并对聚类结果进行恶意代码家族标注；利用标注后的恶意代码家族的基因图谱训练预设的深度学习模型，以建立恶意流量检测模型；利用恶意流量检测模型对...

【技术保护点】
1.一种基于深度学习的恶意流量检测实现方法，其特征在于，所述方法包括：通过动态沙箱技术获得恶意代码的流量会话；将所述恶意代码的流量会话映射为基因图谱并提取图谱特征，利用所述流量会话的图谱特征进行聚类，并对聚类结果进行恶意代码家族标注；利用标注后的恶意代码家族的基因图谱训练预设的深度学习模型，以建立恶意流量检测模型；利用所述恶意流量检测模型对网络实时流量进行检测，实现恶意流量检测。

【技术特征摘要】
1.一种基于深度学习的恶意流量检测实现方法，其特征在于，所述方法包括：通过动态沙箱技术获得恶意代码的流量会话；将所述恶意代码的流量会话映射为基因图谱并提取图谱特征，利用所述流量会话的图谱特征进行聚类，并对聚类结果进行恶意代码家族标注；利用标注后的恶意代码家族的基因图谱训练预设的深度学习模型，以建立恶意流量检测模型；利用所述恶意流量检测模型对网络实时流量进行检测，实现恶意流量检测。2.根据权利要求1所述的基于深度学习的恶意流量检测实现方法，其特征在于，所述通过动态沙箱技术获得恶意代码的流量会话包括：从恶意代码数据库中获取指定类型的恶意代码样本，并从所述恶意代码样本中过滤掉不符合条件的恶意代码样本；利用所述动态沙箱技术执行过滤后剩余的恶意代码样本，并通过钩子HOOK系统应用程序编程接口API的形式监控所执行的恶意代码样本的行为动作，以识别未知恶意文件渗透和命令与控制C&C恶意外联；从沙箱的虚拟机中获取对应样本的网络流量，并从所述网络流量中过滤出合法流量，获取所述恶意代码的流量会话集合。3.根据权利要求1所述的基于深度学习的恶意流量检测实现方法，其特征在于，所述将所述恶意代码的流量会话映射为基因图谱并提取图谱特征，利用所述流量会话的图谱特征进行聚类，并对聚类结果进行恶意代码家族标注包括：对所述恶意代码的流量会话数据进行预处理，以保留区分度大于或等于预设的区分度阈值的数据；利用预设的映射算法，将预处理后的恶意代码的流量会话集合映射为预设大小的基因图谱；利用图谱特征提取算法提取所述基因图谱的图谱特征，构造恶意流量基因图谱的图谱特征集合；对所述恶意流量基因图谱的图谱特征集合进行抽样，构造图谱特征子集合，执行预聚类过程，以挑选出所需的聚类算法；在确定所需的聚类算法之后，基于全量恶意流量基因图谱的图谱特征集合进行聚类；使用预设的杀毒软件对恶意流量基因图谱的聚类簇进行家族标注，构造深度学习所需的训练样本集合。4.根据权利要求1所述的基于深度学习的恶意流量检测实现方法，其特征在于，所述方法还包括：预先利用深度学习技术构建所述深度学习模型，并设置所述深度学习模型的网络结构参数和训练权重。5.根据权利要求3所述的基于深度学习的恶意流量检测实现方法，其特征在于，所述利用标注后的恶意代码家...

【专利技术属性】
技术研发人员：曲武，
申请(专利权)人：北京金睛云华科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人