一种僵尸网络分布式实时检测方法和系统技术方案

技术编号：13504508 阅读：80 留言：0更新日期：2016-08-10 04:29

本发明专利技术公开了一种僵尸网络分布式实时检测方法和系统，包括：数据生成组件生成网络流量元数据Netflow信息，并发送给数据检测组件；数据检测组件的检测模型训练单元从经过标注的训练数据中提取多个训练检测特征，建立作为实时检测单元的检测标准的检测模型；数据检测组件的实时检测单元接收实时发送的Netflow信息，并提取多个检测特征，与上述检测模型进行比较，当比较结果匹配时，得出包括检测对象标识符的告警信息，将所述告警信息与主机黑白名单比较，得出确认受控僵尸主机和可疑受控僵尸主机。本发明专利技术的方案既可以应用在千兆流量的企业网，又可以应用到ISPs网络中；提高了僵尸网络检测的总体检测性能。

全部详细技术资料下载

【技术实现步骤摘要】
一种僵尸网络分布式实时检测方法和系统
本专利技术涉及通讯领域，尤其涉及一种僵尸网络分布式实时检测方法和系统。
技术介绍
当前，全球互联网安全威胁正处于深远变革阶段，攻击者的攻击目的从针对网络架构本身，使其不能够正常使用，转移到以普通用户和相关组织为目标。这类新型攻击直接影响了全球网络用户的日常生活，威胁到了企业用户和政府网络的安全。例如，计算机用户正在遭受间谍软件窥探其敏感信息、垃圾邮件对其邮箱账户进行洪泛攻击、钓鱼网站偷窃认证数据等。这些攻击的核心就是大量被控制的计算机，这些机器可能位于世界各地的家庭、学校、公司或政府。攻击者使用这些受控主机作为匿名代理去隐藏其真实身份和意图，同时放大攻击能力。僵尸恶意程序能够使操作者远程控制受控主机，并将这些主机组织成僵尸网络。僵尸网络问题的范围很难定义，由于其受控主机高度的可转换特性(由受控主机转变为正常主机)，僵尸网络很难检测，甚至很难评估。不过，截止2013年底，CERT已经报道最大的僵尸网络包含近500,000受控主机，而且已经报告的受控主机数目接近300万。目前，传统的基于主机的僵尸恶意软件检测方法，例如反病毒扫描器，对于检测僵尸网络具有一定的局限性。为了辅助检测，基于网络的僵尸网络检测方法已经被提出来，并开始被广泛研究。当前，对于僵尸网络的检测多采用事后处理机制，即类CERT机构在发现某个大型网站或重要网络受到DDoS攻击或垃圾邮件攻击时，才开始协调相关部门和安全企业进行调查，其调查结果多数情况是不能够定位僵尸网络控制节点和攻击发起人，甚至不能够发现实施攻击的僵尸网络受控主机。这个过程中，攻击所造成的损失以...

【技术保护点】
一种僵尸网络分布式实时检测方法，其特征在于，所述方法包括：数据生成组件接收网络流量生成网络流量元数据Netflow信息，并将所述Netflow信息发送给数据检测组件；所述数据检测组件的检测模型训练单元，从经过标注的训练数据中提取多个训练检测特征，基于所述训练检测特征，建立作为所述实时检测单元的检测标准的检测模型；所述数据检测组件的实时检测单元，接收所述数据生成组件实时发送的所述Netflow信息，基于所述Netflow信息提取多个检测特征，将所述检测特征与所述检测模型进行比较，当比较结果匹配时，得出包括检测对象标识符的告警信息，将所述告警信息与主机黑白名单相比较，得出确认受控僵尸主机和可疑受控僵尸主机。

【技术特征摘要】
1.一种僵尸网络分布式实时检测方法，其特征在于，所述方法包括：数据生成组件接收网络流量生成网络流量元数据Netflow信息，并将所述Netflow信息发送给数据检测组件；所述数据检测组件的检测模型训练单元，从经过标注的训练数据中提取多个训练检测特征，基于所述训练检测特征，建立作为实时检测单元的检测标准的检测模型；所述数据检测组件的实时检测单元，接收所述数据生成组件实时发送的所述Netflow信息，基于所述Netflow信息提取多个检测特征，将所述检测特征与所述检测模型进行比较，当比较结果匹配时，得出包括检测对象标识符的告警信息，将所述告警信息与主机黑白名单相比较，得出确认受控僵尸主机和可疑受控僵尸主机；其中，所述检测模型的建立包括以下步骤：构建主机关系链训练子单元基于火花流SparkStream分布式流处理引擎和所述训练数据，建立训练多级主机访问关系链；构建主机Netflow图谱训练子单元基于所述SparkStream分布式流处理引擎和所述训练数据，建立训练主机Netflow图谱；基于统计的特征提取训练子单元分析所述训练主机访问关系链、所述训练主机Netflow图谱和所述Netflow信息，提取多个所述训练检测特征，形成多个训练检测特征向量；建立检测模型子单元基于所述多个训练检测特征向量建立所述检测模型。2.如权利要求1所述的方法，其特征在于，所述数据生成组件接收网络流量生成网络流量元数据Netflow信息是指：所述数据生成组件的网络设备接收所述网络流量生成标准的Netflow信息；或，所述数据生成组件的安全设备或软件接收所述网络流量生成自定义的Netflow信息。3.如权利要求2所述的方法，其特征在于，所述训练数据是指：所述数据检测组件的僵尸恶意样本处理单元根据僵尸恶意样本家族的分类结果，在可控的虚拟机或沙箱环境下执行同一个家族的恶意代码，捕获和存储所有的原始网络流量，所述安全设备或软件对所述原始网络流量进行包重组为原始流并从所述原始流中提取的所述自定义的Netflow信息。4.如权利要求1所述的方法，其特征在于，多个所述训练检测特征包括：主机访问关系链、平均间隔、平均流持续时长、平均流大小、对于流起始时间的傅里叶变换、IP地址熵、上下行流量比、流量负载熵。5.如权利要求1所述的方法，其特征在于，所述建立检测模型子单元建立所述检测模型的过程包括：使用聚类算法分别对所述多个训练检测特征向量的各个分量进行聚类，删除不符合聚类评估函数的聚类簇，基于剩余的所述聚类簇建立所述检测模型。6.如权利要求1所述的方法，其特征在于，所述得出确认受控僵尸主机和可疑受控僵尸主机的步骤包括；构建主机关系链实时子单元基于SparkStream分布式流处理引擎和实时的Netflow信息建立实时多级主机访问关系链；构建主机Netflow图谱实时子单元基于所述SparkStream分布式流处理引擎和所述实时的Netflow信息，建立实时主机Netflow图谱；基于统计的特征提取实时子单元分析所述实时主机访问关系链、所述实时主机Netflow图谱和所述实时的Netflow信息，提取多个所述检测特征，组成检测特征向量；僵尸主机检测单元将获取的待检测的所述检测特征向量的每个分量与所述检测模型进行比较，并根据所述每个分量对检测精度的影响不同给予不同的权重，根据比较结果命中的分量和所述权重计算所述检测特征向量的总体评分；判断所述总体评分是否超过预定的阈值，如果超过所述阈值，发出包括所述检测对象标识符的告警信息；否则，标注正常，进行下一轮的检测；黑白名单子单元将所述告警信息中的所述检测对象标识符与白名单进行比较，删除与所述白名单相匹配的主机，过滤误报主机；还用于将所述告警信息中的所述检测对象标识符与黑名单进行比较，检测出与所述黑名单相匹配的主机，确认为所述受控僵尸主机；将与所述白名单和所述黑名单都不匹配的主机确认为所述可疑受控僵尸主机；并且根据确认结果，更新所述黑名单和所述白名单的内容。7.一种僵尸网络分布式实时检测系统，其特征在于，所述系统包括：数据生成组件和数据检测组件；所述数据生成组件，用于接收网络流量生成网络流量元数据Netflow信息，并将所述Netf...

【专利技术属性】
技术研发人员：胡卫华，班晓芳，曲武，张利，孟祥杰，刘锡峰，梁杰，
申请(专利权)人：中国信息安全测评中心，北京启明星辰信息安全技术有限公司，北京启明星辰信息技术股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人