域名类别预测方法、装置、设备及存储介质制造方法及图纸

技术编号:37771515 阅读:24 留言:0更新日期:2023-06-06 13:36
本发明专利技术公开了一种域名类别预测方法、装置、设备及存储介质。其中,所述方法包括:获取第一样本数据集和第二样本数据集;所述第一样本数据集是由与各个域名分别对应的第一特征序列构成的集合;所述第二样本数据集是由与各个域名分别对应的第二特征序列构成的集合;将所述第一样本数据集输入至第一预测模型进行训练,得到用于预测域名类别的第一神经网络模型;并将所述第二样本数据集输入至第二预测模型进行训练,得到用于预测域名类别的第二神经网络模型;基于所述第一神经网络模型和所述第二神经网络模型,确定待测域名的类别。确定待测域名的类别。确定待测域名的类别。

【技术实现步骤摘要】
域名类别预测方法、装置、设备及存储介质


[0001]本专利技术涉及网络安全
,尤其涉及一种域名类别预测方法、装置、设备及存储介质。

技术介绍

[0002]目前,恶意域名包括恶意网站域名、恶意程序主控端域名、僵尸网络主控端域名等等。为了躲避检测,恶意域名的生成方法逐步像正常网站域名的生成方法靠近,如基于随机的单词组合生成域名,或者,基于单词和数字的组合规则生成域名,导致生成的恶意域名与正常网站的域名难以区分。

技术实现思路

[0003]有鉴于此,本专利技术实施例期望提供一种域名类别预测方法、装置、设备及存储介质。
[0004]本专利技术实施例的技术方案是这样实现的:
[0005]本专利技术的至少一个实施例提供了一种域名类别预测方法,所述方法包括:
[0006]获取第一样本数据集和第二样本数据集;所述第一样本数据集是由与各个域名分别对应的第一特征序列构成的集合;所述第二样本数据集是由与各个域名分别对应的第二特征序列构成的集合;
[0007]将所述第一样本数据集输入至第一预测模型进行训练,得到用于本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种域名类别预测方法,其特征在于,所述方法包括:获取第一样本数据集和第二样本数据集;所述第一样本数据集是由与各个域名分别对应的第一特征序列构成的集合;所述第二样本数据集是由与各个域名分别对应的第二特征序列构成的集合;将所述第一样本数据集输入至第一预测模型进行训练,得到用于预测域名类别的第一神经网络模型;并将所述第二样本数据集输入至第二预测模型进行训练,得到用于预测域名类别的第二神经网络模型;基于所述第一神经网络模型和所述第二神经网络模型,确定待测域名的类别。2.根据权利要求1所述的方法,其特征在于,所述基于所述第一神经网络模型和所述第二神经网络模型,确定待测域名的类别,包括:利用所述第一神经网络模型和所述第二神经网络模型分别对待测域名进行预测,得到第一预测结果和第二预测结果;确定所述待测域名的注册网站的第一可信度;并确定所述待测域名中顶级域名的第二可信度;利用所述第一样本数据集合或所述第二样本数据集,确定顶级域名与包含所述顶级域名的恶意域名的占比;利用所述第一预测结果和所述第二预测结果,结合所述第一可信度、第二可信度和占比中至少两个,确定所述待测域名的类别。3.根据权利要求2所述的方法,其特征在于,所述确定所述待测域名的注册网站的第一可信度,包括:获取所述待测域名的注册网站所需的注册信息;根据所述注册信息,确定所述待测域名的注册网站的第一可信度。4.根据权利要求2所述的方法,其特征在于,所述确定所述待测域名中顶级域名的第二可信度,包括:获取所述待测域名中顶级域名的各个注册网站所需的注册信息,得到多个注册信息;根据所述多个注册信息,确定所述待测域名中顶级域名的第二可信度。5.根据权利要求2所述的方法,其特征在于,所述利用所述第一样本数据集合或所述第二样本数据集,确定顶级域名与包含所述顶级域名的恶意域名的占比,包括:从与各个域名分别对应的第一特征序列中统计与各个顶级域名分别对应的特征序列的第一数量;并统计各个域名中包含各个顶级域名的恶意域名的第二数量;基于统计的第一数量和第二数量,得到顶级域名与包含所述顶级域名的恶意域名的占比;或者,从与各个域名分别对应的第二特征序列中统计与各个顶级域名分别对应的特征序列的第三数量;并...

【专利技术属性】
技术研发人员:陈璨璨付俊刘海霞
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1