The invention provides a method for portraying domain names based on geographic information, which solves the existing technical problems: domain name Description mainly focuses on its application and is not convenient for illegal domain name mining; it includes the following steps: 1. Preprocessing domain names: (1) verifying the validity of domain names; (2) extracting registered domain names and homepage domains of websites. Step 2: Obtain multi-source geographic information; (1) Obtain the geographic information in the ICP filing of the website according to the domain name of the website homepage; (2) Obtain the geographic information in the WHO information of the domain name according to the registered domain name; (3) Obtain IP geographic information of the domain name according to the domain name of the website homepage; (3) Standardize the multi-source geographic information; 4. evaluate the geographic information consistency index of the domain name and complete the domain name portrait. The invention is widely applied to the field of information technology.
【技术实现步骤摘要】
基于地理信息对域名进行画像的方法
本专利技术涉及一种对域名的特征进行描述的方法,特别是涉及一种基于地理信息对域名进行画像的方法。
技术介绍
近年来,互联网的发展迅速,其已融入到人类生活的各个方面。域名作为伴随互联网最早出现的产物之一,也越来越被人们认识与普及。域名从申请注册到投入使用,整个过程域名产生特征。在传统技术上,对域名的描述,主要侧重在其应用上,例如域名作为Web网站使用,作为邮件服务器地址等。而尚未从其他角度刻画域名的特征,对其他信息了解甚少,且不便于非法域名的挖掘。
技术实现思路
本专利技术针对现有技术问题:域名描述主要侧重在其应用,不便于非法域名挖掘,提供一种便于非法域名挖掘的基于地理信息的的域名特征画像的方法。为此,本专利技术的技术方案是,包括以下步骤:步骤1.对域名进行预处理:(3)验证域名是否合法;(4)提取注册域名和网站首页域名;步骤2.获取多源地理信息;(1)根据网站首页域名,获取网站的ICP备案中的地理信息;(2)根据注册域名,获取域名的WHOIS信息中地理信息;(3)根据网站首页域名,获取域名的IP地理信息;步骤3.对多源地理信息进行标准化 ...
【技术保护点】
1.一种基于地理信息对域名进行画像的方法,其特征是,包括以下步骤:步骤1.对域名进行预处理:(1)验证域名是否合法;(2)提取注册域名和网站首页域名;步骤2.获取多源地理信息;(1)根据网站首页域名,获取网站的ICP备案中的地理信息;(2)根据注册域名,获取域名的WHOIS信息中地理信息;(3)根据网站首页域名,获取域名的IP地理信息;步骤3.对多源地理信息进行标准化;步骤4.评估域名的地理信息一致性指数,完成域名画像。
【技术特征摘要】
1.一种基于地理信息对域名进行画像的方法,其特征是,包括以下步骤:步骤1.对域名进行预处理:(1)验证域名是否合法;(2)提取注册域名和网站首页域名;步骤2.获取多源地理信息;(1)根据网站首页域名,获取网站的ICP备案中的地理信息;(2)根据注册域名,获取域名的WHOIS信息中地理信息;(3)根据网站首页域名,获取域名的IP地理信息;步骤3.对多源地理信息进行标准化;步骤4.评估域名的地理信息一致性指数,完成域名画像。2.根据权利要求1所述的基于地理信息对域名进行画像的方法,其特征在于,所述步骤2中的(1),具体步骤是:a.获取网站在工信部的备案信息,方法有两种:1)利用网络爬虫获取网站首页填写的ICP备案信息;2)查询ICP备案权威网站,获取网站的ICP备案信息;b.根据备案的组成规则,提取出直辖市或省份简称。3.根据权利要求1所述的基于地理信息对域名进行画像的方法,其特征在于,所述步骤2中的(2),具体步骤是:a.通过与域名对应的WHOIS服务器交互,获取域名的原始W...
【专利技术属性】
技术研发人员:张兆心,程亚楠,吴晓宝,崔诗尧,杜跃进,陆柯羽,
申请(专利权)人:哈尔滨工业大学威海,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。