基于深度学习的域名检测方法、装置、设备和存储介质制造方法及图纸

技术编号:20451763 阅读:41 留言:0更新日期:2019-02-27 04:37
本申请公开了一种基于深度学习的域名检测方法、装置、设备和存储介质,该方法包括:获取服务器流量数据,所述服务器流量数据包含域名;对所述服务器流量数据进行初始化处理,确定所述服务器流量数据中的域名对应的词向量;将所述域名对应的词向量输入训练好的最优长短时记忆网络LSTM模型进行域名生成算法DGA域名的检测;其中,所述最优LSTM模型具有域名检测能力。该方法能够对DGA域名进行自动化筛选检测,进一步提高了工作效率。

【技术实现步骤摘要】
基于深度学习的域名检测方法、装置、设备和存储介质
本专利技术一般涉及计算机网络安全
,具体涉及一种基于深度学习的域名检测方法、装置、设备和存储介质。
技术介绍
随着人工智能技术的快速发展,深度学习被应用到越来越多的领域,例如可以进行垃圾分类、网页检索、图像识别及语音识别等,它是机器学习中一种对数据进行表征学习的方法,采用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。DGA(DomainGenerateAlgorithm,简称域名生成算法)是一种利用随机字符来生成C&C域名,从而逃避域名黑名单检测的技术手段,该算法被运用于恶意软件以及远程控制软件上,由于大型公司每日有大量的域名访问,为了维护网络信息安全,检测DGA域名已成为急需解决的问题。传统技术中通过将含有域名的网址输入至网址栏,生成对应的网页,并通过特定软件分析其源码信息和网页信息,从而检测该网页的合法性,如果该网页不存在或不合法,即确定出该网页对应的域名为DGA域名。但是,现有技术中对DGA域名的检测需要连接网络,该过程操作局限性大,且检测灵活性不高,导致工作效率低。专利
技术实现思路
鉴于现有技术本文档来自技高网
...

【技术保护点】
1.一种基于深度学习的域名检测方法,其特征在于,包括:获取服务器流量数据;所述服务器流量数据包含域名;对所述服务器流量数据进行初始化处理,确定所述服务器流量数据中的域名对应的词向量;将所述域名对应的词向量输入训练好的最优长短期记忆网络LSTM模型进行域名生成算法DGA域名的检测;其中,所述最优LSTM模型具有域名检测能力。

【技术特征摘要】
1.一种基于深度学习的域名检测方法,其特征在于,包括:获取服务器流量数据;所述服务器流量数据包含域名;对所述服务器流量数据进行初始化处理,确定所述服务器流量数据中的域名对应的词向量;将所述域名对应的词向量输入训练好的最优长短期记忆网络LSTM模型进行域名生成算法DGA域名的检测;其中,所述最优LSTM模型具有域名检测能力。2.根据权利要求1所述的域名检测方法,其特征在于,对所述服务器流量数据进行初始化处理,确定所述服务器流量数据中的域名对应的词向量,包括:从所述服务器流量数据中提取所述域名;将所述域名按照预设的标准格式进行转换,得到转换后的域名;将所述转换后的域名向量化,得到所述转换后的域名对应的词向量。3.根据权利要求2所述的域名检测方法,其特征在于,将所述域名按照预设的标准格式进行转换,得到转换后的域名,包括:将所述域名中的大写英文字母转换为小写英文字母;当所述域名的字符长度超过预设的最大字符长度时,从后往前截取所述最大字符长度,确定为所述转换后的域名。4.根据权利要求1所述的域名检测方法,其特征在于,所述方法还包括:获取预设数量的历史域名数据和所述历史域名数据的域名类别;所述域名类别包括:DGA域名和非DGA域名;按照标准格式和最大字符长度,对所述历史域名数据进行预处理;将预处理后的历史域名数据和所述历史域名数据的域名类别转换为词向量;根据所述词向量对预设的LSTM模型进行训练,得到所述最优LSTM模型。5.根据权利要求4所述的域名检测方法,其特征在于,根据所述词向量对预设的LSTM模型进行训练,得到所述最优LSTM模型,包括:将所述词向量随...

【专利技术属性】
技术研发人员:王南飞张振海胡泽柱
申请(专利权)人:顺丰科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1