基于随机森林的DGA域名检测方法技术

技术编号：13186323 阅读：791 留言：0更新日期：2016-05-11 16:41

本发明专利技术公开了一种基于随机森林的DGA域名检测方法，步骤一，构建知识库，包括构建黑白名单样本库和单词词典；步骤二，设定域名特征模板，将黑白名单中的域名作为训练集，过滤掉噪音，训练并离线保存随机森林算法模型；步骤三，获取待检测域名，加载最优随机森林算法模型，将待检测域名作为输入，得到预测结果。本发明专利技术不依赖在线获取DNS数据，不仅可以单独、快速完成DGA域名检测，也可以为其他恶意域名检测方法提供预测；此外，该方法基于随机森林算法，在噪音干扰上具有明显的优势，使用资源少，运行效率高，泛化性能好。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设及一种基于随机森林的DGA域名检测方法，属于网络安全领域。
技术介绍
恶意域名指传播蠕虫、病毒和特洛伊木马或是进行诈骗、色情内容传播等不法行为的网站域名。随着Domain-Flux Jast-Flux技术越来越广泛的被黑客采用，网络攻击更加隐蔽，恶意追踪更加困难，安全隐患更加长久。其中，由域名生成算法(Domain Generation Algorithm, DGA)生成到的域名被广泛应用于僵尸网络(Botnet)。在大量被僵尸程序所感染的主机(Bot)构成的网络中，攻击者(BotMaster)可W通过控制服务器操控Bot发起各种类型的网络攻击，如分布式拒绝服务(孤oS)、垃圾邮件(Spare)、网络钓鱼(Phishing)、点击欺诈(Click Rraud)W及窃取敏感信息（Information Hieft)等。目前，各种恶意域名检测算法主要分为W下两类： (1)基于构造特征的方法。现有专利包括:基于域名构造特征的挂马网页检测方法 (专利号为201110146967.7)、仿冒域名检测方法及设备(专利号为201210104110.3)。 (2)基于访问行为的方法。现有的专利包括:异常域名检测方法及系统（专利号为 200910237594.7)、非法域名识别方法及装置（专利号为201110382578.4)、一种Domain Flux僵尸网络域名检测（专利号为201210475596.1)。上述两类方法存在着如下局限性：1、基于构造特征的方法中，现有的两种专利均从相似性度量出发，通过计算样本对得到阔值，确定待检测...

【技术保护点】
基于随机森林的DGA域名检测方法，其特征在于：包括以下步骤，步骤一，构建知识库，包括构建黑白名单样本库和单词词典；步骤二，设定域名特征模板，将黑白名单中的域名作为训练集，过滤掉噪音，训练并离线保存随机森林算法模型；所述域名特征模板可根据训练反馈进行修改；步骤三，获取待检测域名，加载最优随机森林算法模型，将待检测域名作为输入，得到预测结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：王红凯，张旭东，杨维永，马志程，廖鹏，黄益彬，于晓文，张丹，夏威，宋文杰，
申请(专利权)人：国家电网公司，国网浙江省电力公司信息通信分公司，南京南瑞集团公司，南京南瑞信息通信科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人