网页检测方法与扫描引擎技术

技术编号:7900904 阅读:114 留言:0更新日期:2012-10-23 12:29
本发明专利技术实施例提供了一种网页检测方法与扫描引擎,其中,网页检测方法,包括:抓取目标网站的URL或内容,通过返回的结果确定是网站的网页,访问所述网页;判断访问的网页是否符合以下规则至少之一:通用异常页面规则、自定义异常页面规则、自定义异常页面行为规则;若符合,则确定所述访问的网页为异常页面;其中,所述通用异常页面规则用于根据网页的状态代码或网页内容确定网页是否为异常页面,所述自定义异常页面规则用于根据从网页中提取的异常页面关键字确定网页是否为异常页面,所述自定义异常页面行为规则用于根据设定的访问异常页面的行为确定网页是否为异常页面。通过本发明专利技术实施例,达到了能够准确地对异常页面进行判断的效果。

【技术实现步骤摘要】

【技术保护点】
一种网页检测方法,其特征在于,包括:抓取目标网站的URL或内容,通过返回的结果确定是网站的网页,访问所述网页;判断访问的网页是否符合以下规则至少之一:通用异常页面规则、自定义异常页面规则、自定义异常页面行为规则;若符合,则确定所述访问的网页为异常页面;其中,所述通用异常页面规则用于根据网页的状态代码或网页内容确定网页是否为异常页面,所述自定义异常页面规则用于根据从网页中提取的异常页面关键字确定网页是否为异常页面,所述自定义异常页面行为规则用于根据设定的访问异常页面的行为确定网页是否为异常页面。

【技术特征摘要】

【专利技术属性】
技术研发人员:赵武龙专
申请(专利权)人:奇智软件北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1