一种基于多通道图卷积的恶意域名检测方法及系统技术方案

技术编号：37576488 阅读：18 留言：0更新日期：2023-05-15 07:52

本发明专利技术公开了一种基于多通道图卷积的恶意域名检测方法及系统，涉及网络安全技术领域。所述方法包括：提取DNS解析日志，生成三元组；基于三元组构建域名在多通道空间内的关联关系图；获取完成训练的深度学习网络模型，所述深度学习网络模型包括图卷积神经网络、Attention层和全连接神经网络；根据域名在多通道空间内的关联关系图及域名的向量，基于图卷积神经网络生成域名在多通道空间内的图嵌入向量；将域名的图嵌入向量输入Attention层进行特征选择，将多通道空间内的图嵌入向量聚合为维度相同的单个特征向量序列；将特征向量序列输入全连接神经网络中，得到域名的分类结果。相较于现有技术，本发明专利技术摆脱了对手工设计特征的依赖，提高了检测精度及鲁棒性。提高了检测精度及鲁棒性。提高了检测精度及鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多通道图卷积的恶意域名检测方法及系统

[0001]本专利技术涉及网络安全
，更具体地，涉及一种基于多通道图卷积的恶意域名检测方法及系统。

技术介绍

[0002]恶意域名是指被网络攻击者利用发起恶意活动的域名集，每年由恶意域名实施的攻击活动都能给网络用户造成巨大的损失，所以恶意域名的检测成为阻止恶意活动的重要手段。但随着域名伪装躲避技术的不断发展，如何快速有效的检出恶意域名也成为了网络空间安全中一项重要的研究内容。域名黑名单一直以来是封锁恶意域名的有效手段，但随着网络技术及规模的迅速发展，新的域名也层出不穷，更新极快，黑名单面临频繁更新以及时效性严重不足的问题。为了克服传统黑名单技术的不足，同时也随着机器学习技术的发展，基于特征工程及机器学习方法的检测技术被提出。
[0003]在恶意域名检测过程中，通常使用的特征有两种。一种是域名词汇特征，包括：元音字母数、辅音字母数、重复字符数、重复的字符串数等，这是由域名本身的性质所决定的；而恶意域名，比如DGA类域名，是由特定算法生成的随机字符串，本意是为掩盖少数真实用来实施恶意活动的域名，并没有特定的含义，因此很容易从其词汇特征进行识别。另一种特征是域名的查询特征，通常是由DNS(Domain name system)服务器的解析日志或部署于各DNS服务器的数据探测器收集到的被动DNS数据，它们包含了域名的查询信息以及相关记录的详细内容，通常通过他们提取的查询特征有：TTL(缓存记录有效时间)、域名主机信息、用户主机信息、查询时间间隔、规定时间窗口内的查询...

【技术保护点】

【技术特征摘要】
1.一种基于多通道图卷积的恶意域名检测方法，其特征在于，包括：提取DNS解析日志，生成代表域名、IP、CNAME三类数据关系的三元组，将三元组中的域名和CNAME转化为向量表示；基于三元组构建域名在多通道空间内的关联关系图，包括特征关联图和拓扑关联图；获取完成训练的深度学习网络模型，所述深度学习网络模型包括与通道空间数量相一致的图卷积神经网络、一个Attention层和一个全连接神经网络；其中，所述图卷积神经网络的输出端与Attention层的输入端相连，所述Attention层的输出端与全连接神经网络的输入端相连；根据域名在多通道空间内的关联关系图及域名的向量，基于图卷积神经网络生成域名在多通道空间内的图嵌入向量；所述多通道空间内的图嵌入向量包括域名在特征空间和拓扑空间的图嵌入向量；将域名在多通道空间内的图嵌入向量输入Attention层进行特征选择，将多通道空间内的图嵌入向量聚合为维度相同的单个特征向量序列；将特征向量序列输入全连接神经网络中，得到域名的分类结果；其中，所述分类结果包括恶性域名类和良性域名类。2.根据权利要求1所述的一种基于多通道图卷积的恶意域名检测方法，其特征在于，所述提取DNS解析日志，生成代表域名、IP、CNAME三类数据关系的三元组，将三元组中的域名和CNAME转化为向量表示，包括：分割DNS服务器解析记录，从日志中选取A记录类型解析记录，提取日志中出现的域名集、IP集、CNAME集，形成代表三类数据关系的三元组；对所有三元组中的域名和CNAME进行编码，将其转化为向量表示；所述编码的方式为one
‑
hot、n
‑
gram或自动编码。3.根据权利要求1所述的一种基于多通道图卷积的恶意域名检测方法，其特征在于，所述基于三元组构建域名在多通道空间内的关联关系图，包括：提取所有三元组中域名和CNAME作为域名序列，丢弃其中的重复值，以剩余的域名序列作为特征空间内的关联关系图的节点；对于任一域名，采用KNN算法，计算当前域名与其他域名间的距离度量，选取距离最近的预设数量的域名与当前域名构建关联关系，在其间各添加一条边，代表它们之间的相似关系；当所有域名的边均构建完后，输出生成的无向图，完成特征空间内的关联关系图构建，即特征关联图；提取所有三元组中域名和CNAME作为域名序列，丢弃其中的重复值，以剩余的域名序列作为拓扑空间内的关联关系图的节点；对比检查任两个三元组，判断是否存在两个域名解析至同一IP、两个域名解析至同一CNAME、或两个CNAME解析至同一IP：若是，在对应两个三元组的域名或CNAME之间增加一条边；否则，不进行操作；直至检查完所有三元组，输出生成的无向图，完成拓扑空间内的关联关系图的构建，即拓扑关联图。4.根据权利要求3所述的一种基于多通道图卷积的恶意域名检测方法，其特征在于，所述当前域名与其他域名间的距离度量为余弦距离或欧式距离。5.根据权利要求1所述的一种基于多通道图卷积的恶意域名检测方法，其特征在于，所述图卷积神经网络包括第一图卷积神经网络和第二图卷积神经网络，所述根据域名在多通道空间内的关联关系图及域名的向量，基于图卷积神经网络生成域名在多通道空间内的图
嵌入向量，包括：将特征关联图及域名的向量输入第一图卷积神经网络，所述第一图卷积神经网络将特征关联图中节点及其周边节点的特征信息进行聚合，经循环迭代后输出域名在特征空间内的图嵌入向量；将拓扑关联图及域名的向量输入第二图卷积神经网络，所述第二图卷积神经网络将拓扑关联图中节点及其周边节...

【专利技术属性】
技术研发人员：金舒原，王亚博，
申请(专利权)人：中山大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人