基于DOM树的标签及属性相似性的恶意域名检测方法技术

技术编号:21691411 阅读:44 留言:0更新日期:2019-07-24 16:11
本发明专利技术提供一种基于DOM树的标签及属性相似性的恶意域名检测方法,其解决了现有恶意域名检测方法检测率低、准确性差的技术问题。该方法包括:采集恶意类型域名集,将恶意域名集转化成二进制串存入数据库;将未知类型的域名转化为二进制串;将未知类型域名对应的二进制串与数据库中恶意类型域名集的二进制串对比,通过二者相似度来判断该未知类型域名的恶意性。本发明专利技术可广泛应用于网络安全系统中。

Malicious Domain Name Detection Method Based on DOM Tree Label and Attribute Similarity

【技术实现步骤摘要】
基于DOM树的标签及属性相似性的恶意域名检测方法
本专利技术涉及一种恶意域名检测方法,特别是涉及一种基于DOM树的标签及属性相似性的恶意域名检测方法。
技术介绍
近年来,各类恶意域名数量的持续增长对广大用户的个人隐私、财产安全甚至身心健康造成的巨大威胁,恶意域名的存在严重阻碍着互联网的健康发展。虽然恶意域名数量庞大,但是在实际情况中恶意域名注册者为了达到低成本、快速、大量生成恶意域名的目的,会注册大量不同的域名,但这些域名的网页结构相同或相似。目前从恶意域名对应的网页研究角度出发的恶意域名检测方法主要依赖于网页内容,但是网页内容的不断变化使得从恶意域名的网页内容相似性这一角度出发进行恶意域名的检测率较低,极大地影响了恶意域名网页的识别率,准确性差。
技术实现思路
本专利技术针对现有恶意域名检测方法检测率低、准确性差的技术问题,提供一种准确性高、效率高的基于DOM树的标签及属性相似性的恶意域名检测方法。为此,本专利技术的技术方案是,一种基于DOM树的标签及属性相似性的恶意域名检测方法,包括:采集恶意类型域名集,将恶意域名集转化成二进制串存入数据库;将未知类型的域名转化为二进制串;将未知类型本文档来自技高网...

【技术保护点】
1.一种基于DOM树的标签及属性相似性的恶意域名检测方法,其特征在于,所述方法包括:采集恶意类型域名集,将恶意域名集转化成二进制串存入数据库;将未知类型的域名转化为二进制串;将未知类型域名对应的二进制串与数据库中恶意类型域名集的二进制串对比,通过二者相似度来判断该未知类型域名的恶意性。

【技术特征摘要】
1.一种基于DOM树的标签及属性相似性的恶意域名检测方法,其特征在于,所述方法包括:采集恶意类型域名集,将恶意域名集转化成二进制串存入数据库;将未知类型的域名转化为二进制串;将未知类型域名对应的二进制串与数据库中恶意类型域名集的二进制串对比,通过二者相似度来判断该未知类型域名的恶意性。2.根据权利要求1所述的基于DOM树的标签及属性相似性的恶意域名检测方法,其特征在于,将恶意域名集转化成二进制串的步骤为:(1)获取恶意域名集中每个域名对应的网页加载过程完成后的HTML文档;(2)构造HTML文档对应的DOM树;(3)从每棵DOM树中提取一定层数内的节点标签名及对应的全部属性名,将提取到的标签名及属性名的文本序列转化为二进制串。3.根据权利要求2所述的基于DOM树的标签及属性相似性的恶意域名检测方法,其特征在于,构造HTML文档对应的DOM树具体方法为:利用Python第三方解析库将HTML文档解析成DOM树。4.根据权利要求2所述的基于DOM树的标签及属性相似性的恶意域名检测方法,其特征在于,提取DOM树的标签名和属性名构造文本序列的方法为:对于域名中每个域名的DOM树按照一定的搜索遍历方法遍历一定层数内的每个节点,提取相应节点的标签名和属性名将DOM树结构转为文本序列。5.根据权利要求4...

【专利技术属性】
技术研发人员:张兆心刘晓燕程亚楠许海燕闫健恩
申请(专利权)人:哈尔滨工业大学威海
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1