基于HTTP响应的网站资产失活检测和更新方法技术

技术编号:23608886 阅读:72 留言:0更新日期:2020-03-28 08:58
本发明专利技术提供一种基于HTTP响应的网站资产失活检测和更新方法:包括以下步骤:获取待检测的网站域名;向服务器请求该域名获取HTTP状态码,判断是否属于失活状态码,如果属于失活状态码,网站状态正常,网站不需要更新,流程结束,获取重定向后的网站域名,判断重定向后的网站域名与待检测的网站域名是否相同,爬取重定向后网站的标题、主办单位和域名备案信息;本发明专利技术主要解决网络安全监管部门监管的网站失活但却不能及时更新的问题。监管部门监管的网站大多属于关键信息基础设施,当网站发生域名、IP的更换,而被监管单位并未及时报备到监管部门时,监管部门将不会对新的网站进行网络安全等方面的监管,将导致网站安全监管不到位的问题。

Detection and update method of website assets deactivation based on HTTP response

【技术实现步骤摘要】
基于HTTP响应的网站资产失活检测和更新方法
本专利技术涉及网站资产信息状态的检测技术,具体涉及一种基于HTTP响应的网站资产失活检测和更新方法。
技术介绍
目前,互联网信息发展飞速,网站域名、备案信息等更新也十分频繁。党政机关、大型国企等单位的重要网站属于网络安全监管部门监管的关键信息基础设备。当这些网站资产发生变化而信息不能及时更新时,底层资产的准确性就无法得到保证,将导致监管部门无法对关键信息基础设备的网络安全及时监管的情况。因此,如何及时地更新网站资产、确保监管网站的活跃状态,是本领域需要解决的难题。
技术实现思路
本专利技术要解决的技术问题是提供一种高效的基于HTTP响应的网站资产失活检测和更新方法。为解决上述技术问题,本专利技术提供一种基于HTTP响应的网站资产失活检测和更新方法:包括以下步骤:1)、获取待检测的网站域名;执行步骤2);2)、向服务器请求该域名获取HTTP状态码,判断是否属于失活状态码,如果属于失活状态码,进行步骤11);如果不属于则执行步骤3);3)、判断本文档来自技高网...

【技术保护点】
1.基于HTTP响应的网站资产失活检测和更新方法,其特征在于:包括以下步骤:/n1)、获取待检测的网站域名;执行步骤2);/n2)、向服务器请求该域名获取HTTP状态码,判断是否属于失活状态码,如果属于失活状态码,进行步骤3);如果不属于则执行步骤11);/n3)、判断HTTP响应状态码是否为301或302,如果不是则执行步骤4);如果是则执行步骤5);/n4)、网站状态正常,网站不需要更新,流程结束;/n5)、获取重定向后的网站域名;执行步骤6);/n6)、判断重定向后的网站域名与待检测的网站域名是否相同,如果相同,执行步骤4);如果不相同,执行步骤7);/n7)、爬取重定向后网站的标题、主...

【技术特征摘要】
1.基于HTTP响应的网站资产失活检测和更新方法,其特征在于:包括以下步骤:
1)、获取待检测的网站域名;执行步骤2);
2)、向服务器请求该域名获取HTTP状态码,判断是否属于失活状态码,如果属于失活状态码,进行步骤3);如果不属于则执行步骤11);
3)、判断HTTP响应状态码是否为301或302,如果不是则执行步骤4);如果是则执行步骤5);
4)、网站状态正常,网站不需要更新,流程结束;
5)、获取重定向后的网站域名;执行步骤6);
6)、判断重定向后的网站域名与待检测的网站域名是否相同,如果相同,执行步骤4);如果不相同,执行步骤7);
7)、爬取重定向后网站的标题、主办单位和域名备案信息;执行步骤8);
8)、判断重定向后网站的网站标题、主办单位、备案信息是否接近原网站关键词信息,如果接近执行步骤9),如果不接近执行步骤10);
9)、将待检测的网站域名替换成重定向后的网站域名,结束;
10)、丢弃重定向的网站域名,执行步骤11);
11)、根据原网站关键词信息获取网站的关键词,执行步骤12);
12)、根据关键词从搜索引擎爬取网站信息,获取搜索引擎搜索到的网站域名作为搜索所得网站;执行步骤13);
13)、依序请求每个网站域名,获取HTTP响应状态码;执行步骤14);
14)、判断HTTP响应状态码是否为200,如果不是则执行步骤15);如果是则执行步骤16);
15)、丢弃网站,执行步骤18);
16)、爬取搜索所得...

【专利技术属性】
技术研发人员:吴丹范渊
申请(专利权)人:杭州安恒信息技术股份有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1