域名处理方法、装置、存储介质及处理器制造方法及图纸

技术编号:25315059 阅读:33 留言:0更新日期:2020-08-18 22:32
本申请公开了一种域名处理方法、装置、存储介质及处理器。该方法包括:确定待测域名的固有特征;确定待测域名的词频特征;确定待测域名的向量特征;根据至少一个目标模型处理待测域名的固有特征、词频特征、向量特征以及训练集中的域名特征,得到至少一个处理结果;根据至少一个处理结果确定待测域名是否是恶意域名。通过本申请,解决了相关技术中判断待测域名是否为恶意域名的判断结果不准确的问题。

【技术实现步骤摘要】
域名处理方法、装置、存储介质及处理器
本申请涉及域名识别
,具体而言,涉及一种域名处理方法、装置、存储介质及处理器。
技术介绍
在网络安全领域,恶意域名生成算法经常被用于入侵宿主机器的恶意软件或攻击者的网络通信,使得恶意软件或攻击者与控制服务器进行通信,从而集中控制多个宿主机。因而,恶意域名检测是切断网络入侵与控制通道的关键技术。相关技术中存在多种恶意域名检测技术,主要是使用各不相同的机器学习或者深度学习领域的算法来判定域名是否为恶意,为了让算法的检测准确度更高,需要准备算法最需要的基础数据,具体地,可以通过公开途径获得基础数据,也可以通过网络数据包进行提取,并对训练结果进行回测,以获得最佳模型。但是,这些恶意域名检测仅是对当前可以获得的知识进行描述的最好的模型,随着模型训练的训练以及新数据的产生,导致在某一时刻的最佳模型会随着时间慢慢弱化,域名判断的准确率不断下降。针对相关技术中判断待测域名是否为恶意域名的判断结果不准确的问题,目前尚未提出有效的解决方案。
技术实现思路
申请提供一种域名处理本文档来自技高网...

【技术保护点】
1.一种域名处理方法,其特征在于,包括:/n确定待测域名的固有特征,其中,所述固有特征至少包括以下之一:域名的信息熵、域名长度、域名中元音字母的占比、域名中数字字符的占比以及域名后缀是否为预设后缀;/n确定所述待测域名的词频特征,其中,所述词频特征用于表征一个域名与训练集中的整体正面域名以及整体负面域名在字符上的相似性;/n确定所述待测域名的向量特征,其中,所述向量特征用于表征一个域名的每个字符的相关性与所述训练集中的域名的每个字符的相关性之间的相似性;/n根据至少一个目标模型处理所述待测域名的所述固有特征、所述词频特征、所述向量特征以及所述训练集中的域名特征,得到至少一个处理结果,其中,所述...

【技术特征摘要】
1.一种域名处理方法,其特征在于,包括:
确定待测域名的固有特征,其中,所述固有特征至少包括以下之一:域名的信息熵、域名长度、域名中元音字母的占比、域名中数字字符的占比以及域名后缀是否为预设后缀;
确定所述待测域名的词频特征,其中,所述词频特征用于表征一个域名与训练集中的整体正面域名以及整体负面域名在字符上的相似性;
确定所述待测域名的向量特征,其中,所述向量特征用于表征一个域名的每个字符的相关性与所述训练集中的域名的每个字符的相关性之间的相似性;
根据至少一个目标模型处理所述待测域名的所述固有特征、所述词频特征、所述向量特征以及所述训练集中的域名特征,得到至少一个处理结果,其中,所述目标模型由所述训练集中的域名特征训练得到,所述训练集中的域名特征包括所述训练集中的各个域名的所述固有特征、所述词频特征、所述向量特征以及预设域名的外部特征,所述外部特征为外部系统判定一个域名判定为正面域名还是负面域名的判定结果;
根据所述至少一个处理结果确定所述待测域名是否是恶意域名。


2.根据权利要求1所述的方法,其特征在于,在根据至少一个目标模型处理所述待测域名的所述固有特征、所述词频特征、所述向量特征以及所述训练集中的域名特征,得到至少一个处理结果之前,所述方法还包括:
获取所述待测域名的所述外部特征;
根据至少一个目标模型处理所述待测域名的所述固有特征、所述词频特征、所述向量特征以及所述训练集中的域名特征,得到至少一个处理结果包括:根据所述至少一个机器模型处理所述待测域名的所述固有特征、所述词频特征、所述向量特征、所述外部特征以及所述训练集中的域名特征,得到所述至少一个处理处理结果。


3.根据权利要求1所述的方法,其特征在于,根据所述至少一个处理结果确定所述待测域名是否是恶意域名包括:
确定所述至少一个处理结果中指示所述待测域名为所述正面域名的处理结果的数量,得到第一数量;
确定所述至少一个处理结果中指示所述待测域名为所述负面域名的处理结果的数量,得到第二数量;
比较所述第一数量和所述第二数量,并根据比较结果确定所述待测域名是否为所述恶意域名。


4.根据权利要求1所述的方法,其特征在于,在根据至少一个目标模型处理所述待测域名的所述固有特征、所述词频特征、所述向量特征以及所述训练集中的域名特征,得到至少一个处理结果之前,所述方法还包括:
采集多个正面域名和多个负面域名,并由所述多个正面域名和所述多个负面目标域名确定所述训练集;
确定所述训练集中的各个域名的所述固有特征、所述词频特征、所述向量特征,并获取所述训练集中的预设域名的外部特征;
将所述训练集中的所述各个域名的所述固有特征、所述词频特征、所述向量特征以及所述预设域名的外部特征,确定为所述训练集中的域名特征;
采用至少一个机器学习模型训练所述训练集中的域名特征,得到所述至少一个目标模型。


5.根据权利要求4所述的方法,其特征在于,在根据所述至少一个处理结果确定所述待测域名是否是恶意域名之后,所述方法还包括:
将所述待测域名添加至所述训练集中,得到更新后的训练集;
将所述待测域名是否是恶意域名的确定结果作为所述待测域名的所述外部特征;
将所述待测域名的所述固有特征、所述词频特征、所述向量特征以及所述外部特征添加至所述训练集中的域名特征,得到所述更新后的训练集中的域名特征;
采用所述至少一个机器学习模型训练所述更新后的训练集中的域名特征,得到所述至少一个更新后的目标模型。


6.根据权利要求4所述的方法,其特征在于,采集所述多个正面域名包括:
从数据库中的正面域名源中获取前预设个数的域名,得到所述多个正面域名,其中,所述正面域名源中的域名按照预设顺序进行存储。


7.根据权利要求4所述的方法,其特征在于,采集所述多个负面域名包括:
根据数据库中的负面域名源中包含的域名个数,以及待采集的负面域名的个数,确...

【专利技术属性】
技术研发人员:袁巍张晔
申请(专利权)人:山石网科通信技术股份有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1