域名检测方法、域名检测装置和设备以及介质制造方法及图纸

技术编号:26041468 阅读:58 留言:0更新日期:2020-10-23 21:20
本申请提供了一种域名检测方法、域名检测装置、域名检测设备以及计算机可读存储介质。所述域名检测方法包括:获取待检测域名;对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量;对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量;基于所述有效特征向量,对所述待检测域名进行安全风险等级分类,以确定所述待检测域名的安全风险等级类别;根据所述待检测域名的安全风险等级类别,对所述待检测域名进行网页分类处理或域名风险扫描处理;以及基于所述处理的结果确定并输出所述待检测域名的检测结果。

【技术实现步骤摘要】
域名检测方法、域名检测装置和设备以及介质
本申请涉及互联网领域,并且具体地涉及一种域名检测方法、域名检测装置、域名检测设备以及计算机可读存储介质。
技术介绍
在如今的互联网环境中,网络安全变得日益重要,例如威胁情报的网络安全信息对于网络安全分析和运维至关重要。威胁情报,也称为IOC(IndicatorofCompromise,威胁指示)情报,是一种基于证据的知识,包括了情境、机制、指标、隐含和实际可行的建议。威胁情报描述了现存的、或者是即将出现的针对资产的威胁或危险,并可以用于通知主体针对相关威胁或危险采取某种响应。目前,威胁情报主要来源于开源情报和沙箱情报,而开源情报依赖于开源数据和各大情报厂商,缺乏自主性,沙箱情报则情报类型单一、数量有限。域名检测可以用于获取威胁情报,然而,当前域名检测常依赖于人工鉴定,效率低下,难以处理大量的域名数据。因此,需要一种能够高效准确地进行域名检测的方法。近年来,机器学习技术快速发展。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。机器学习技术给域名检测提供了新的思路。
技术实现思路
为了克服现有技术中存在的缺陷,本申请提出了一种域名检测方法、域名检测装置、域名检测设备以及计算机可读存储介质。根据本申请的一个方面,提供了一种域名检测方法,包括:获取待检测域名;对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量;对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量;基于所述有效特征向量,对所述待检测域名进行安全风险等级分类,以确定所述待检测域名的安全风险等级类别;根据所述待检测域名的安全风险等级类别,对所述待检测域名进行网页分类处理或域名风险扫描处理;以及基于所述处理的结果确定并输出所述待检测域名的检测结果。根据本申请的一个示例,其中,所述安全风险等级类别是黑域名、白域名和灰域名中的一个,并且其中,黑域名为安全风险高的域名,白域名为安全风险低的域名,灰域名为安全风险处于黑域名和白域名之间的域名。根据本申请的一个示例,其中,对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量包括:提取所述待检测域名的域名字符特征、样本关联特征、域名属性特征和网络访问特征中的至少一部分特征,作为所述待检测域名的特征数据;以及利用所述待检测域名的特征数据,生成所述特征向量。根据本申请的一个示例,其中,对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量包括:利用图形数据库对所述域名进行分析,以提取所述待检测域名的特征向量,其中,所述图形数据库存储域名与其特征向量的对应关系。根据本申请的一个示例,其中,对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量包括:确定所述待检测域名的特征向量是否稀疏;以及在确定所述特征向量不稀疏的情况下,确定所述特征向量为有效特征向量;在所述特征向量稀疏的情况下,丢弃所述特征向量,其中,所述稀疏指示所述待检测域名在预定时间段内未被访问、被解析且被浏览过。根据本申请的一个示例,其中,在所述待检测域名的安全风险等级类别为黑域名或者白域名时,对所述待检测域名指向的网页进行网页分类处理,所述网页分类处理包括:在所述网页中包括的指定元素的数量满足预定阈值时,确定所述网页为正常网页;在所述网页中包括的指定元素的数量不满足预定阈值时,确定所述网页为非正常网页;以及在所述网页过期时,确定所述网页为过期网页。根据本申请的一个示例,其中,在所述待检测域名的安全风险等级类别为黑域名时,基于所述处理的结果确定所述待检测域名的检测结果包括:在所述网页为正常网页的情况下,确定所述待检测域名为失陷域名;在所述网页为非正常网页的情况下,确定所述待检测域名为恶意域名;以及在所述网页为过期网页的情况下,确定所述待检测域名为过期域名。根据本申请的一个示例,其中,在所述待检测域名的安全风险等级类别为白域名时,基于所述处理的结果确定所述待检测域名的检测结果包括:在所述网页为正常网页并且所述待检测域名的广度满足预定条件的情况下,确定所述待检测域名为安全域名,并将所述待检测域名加入域名白名单;在所述网页为过期网页的情况下,确定所述待检测域名为过期域名。根据本申请的一个示例,其中,在所述待检测域名的安全风险等级类别为灰域名时,对所述待检测域名进行域名风险扫描处理,所述域名风险扫描处理包括:根据预定规则对所述待检测域名进行域名风险扫描,并根据扫描结果生成对所述待检测域名进行鉴定处理的指示。根据本申请的一个示例,其中,基于所述有效特征向量,对所述待检测域名进行安全风险等级分类,以确定所述待检测域名的安全风险等级类别包括:基于所述有效特征向量,利用域名分类模型对所述待检测域名进行安全风险等级分类,以确定所述待检测域名的安全风险等级类别,其中,所述域名分类模型通过以下方法进行训练:获取包括不同安全风险等级类别的训练域名的训练域名集,其中每个训练域名的训练数据包括所述训练域名的特征数据和所述训练域名的类别;针对所述训练域名集中的每个训练域名,基于所述训练域名对应的特征数据,生成所述训练域名的有效特征向量;以及利用所述训练域名集中的每个训练域名的有效特征向量和安全风险等级类别,对所述域名分类模型进行训练。根据本申请的一个示例,其中,所述不同安全风险等级类别包括黑域名、白域名和灰域名,并且其中,所述获取包括不同安全风险等级类别的训练域名的训练域名集包括:从可疑域名集获取可疑域名,将通过对可疑域名进行鉴定确定的恶意域名作为黑域名类别的训练域名,并且将通过对可疑域名进行鉴定确定的非恶意域名作为灰域名类别的训练域名;获取高广度域名,作为白域名类别的训练域名,其中,所述高广度域名为被访问的频率满足预定条件的域名。根据本申请的一个示例,其中,所述获取包括不同安全风险等级类别的训练域名的训练域名集还包括:从多个关联恶意域名中随机抽样预定数量的域名作为黑域名类别的训练域名,其中,多个关联恶意域名是同一二级域名下的多个子域名。根据本申请的一个示例,其中,所述特征数据包括所述训练域名的域名字符特征、样本关联特征、域名属性特征和网络访问特征中的至少一部分。根据本申请的另一方面,提供了一种域名检测装置,包括:域名获取单元,被配置为获取待检测域名;特征向量生成单元,被配置为对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量;特征稀疏检测单元,被配置为对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量;分类单元,被配置为基于所述有效特征向量,对所述待检测域名进行安全风险等级分类,以确定所述待检测域名本文档来自技高网...

【技术保护点】
1.一种域名检测方法,包括:/n获取待检测域名;/n对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量;/n对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量;/n基于所述有效特征向量,对所述待检测域名进行安全风险等级分类,以确定所述待检测域名的安全风险等级类别;/n根据所述待检测域名的安全风险等级类别,对所述待检测域名进行网页分类处理或域名风险扫描处理;以及/n基于所述处理的结果确定并输出所述待检测域名的检测结果。/n

【技术特征摘要】
1.一种域名检测方法,包括:
获取待检测域名;
对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量;
对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量;
基于所述有效特征向量,对所述待检测域名进行安全风险等级分类,以确定所述待检测域名的安全风险等级类别;
根据所述待检测域名的安全风险等级类别,对所述待检测域名进行网页分类处理或域名风险扫描处理;以及
基于所述处理的结果确定并输出所述待检测域名的检测结果。


2.根据权利要求1所述的域名检测方法,其中,所述安全风险等级类别是黑域名、白域名和灰域名中的一个,并且其中,黑域名为安全风险高的域名,白域名为安全风险低的域名,灰域名为安全风险处于黑域名和白域名之间的域名。


3.根据权利要求1所述的域名检测方法,其中,对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量包括:
提取所述待检测域名的域名字符特征、样本关联特征、域名属性特征和网络访问特征中的至少一部分特征,作为所述待检测域名的特征数据;以及
利用所述待检测域名的特征数据,生成所述特征向量。


4.根据权利要求1所述的域名检测方法,其中,对所述待检测域名进行特征向量提取,以生成所述待检测域名的特征向量包括:
利用图形数据库对所述域名进行分析,以提取所述待检测域名的特征向量,
其中,所述图形数据库存储域名与其特征向量的对应关系。


5.根据权利要求1所述的域名检测方法,其中,对所述待检测域名的特征向量进行特征稀疏检测,以获得所述待检测域名的有效特征向量包括:
确定所述待检测域名的特征向量是否稀疏;以及
在确定所述特征向量不稀疏的情况下,确定所述特征向量为有效特征向量;在所述特征向量稀疏的情况下,丢弃所述特征向量,
其中,所述稀疏指示所述待检测域名在预定时间段内未被访问、被解析且被浏览过。


6.根据权利要求2所述的域名检测方法,其中,在所述待检测域名的安全风险等级类别为黑域名或者白域名时,对所述待检测域名指向的网页进行网页分类处理,所述网页分类处理包括:
在所述网页中包括的指定元素的数量满足预定阈值时,确定所述网页为正常网页;
在所述网页中包括的指定元素的数量不满足预定阈值时,确定所述网页为非正常网页;以及
在所述网页过期时,确定所述网页为过期网页。


7.根据权利要求6所述的域名检测方法,其中,在所述待检测域名的安全风险等级类别为黑域名时,基于所述处理的结果确定所述待检测域名的检测结果包括:
在所述网页为正常网页的情况下,确定所述待检测域名为失陷域名;
在所述网页为非正常网页的情况下,确定所述待检测域名为恶意域名;以及
在所述网页为过期网页的情况下,确定所述待检测域名为过期域名。


8.根据权利要求6所述的域名检测方法,其中,在所述待检测域名的安全风...

【专利技术属性】
技术研发人员:马江夏林智鑫
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1