一种网页中携带恶意代码的检测方法和装置制造方法及图纸

技术编号:23605003 阅读:27 留言:0更新日期:2020-03-28 06:01
本发明专利技术涉及互联网技术领域,提供了一种网页中携带恶意代码的检测方法和装置。方法包括使用搜索引擎爬虫的User‑agent,赋值第一网址请求消息中的User_agent字段后,向待检测网页的地址发送第一网址请求消息;使用普通终端用户的User‑agent,赋值第二网址请求消息中的User_agent字段后,向待检测网页的地址发送第二网址请求消息;匹配第一响应消息和第二响应消息中所携带的内容,若匹配结果差异性大于预设条件,则将待检测网页标定为潜在携带恶意代码的网站。本发明专利技术通过模拟搜索引擎爬虫爬取网站首页内容,模拟正常用户爬取网站首页内容,并比较下标题的差异,对黑帽SEO类的挂马有很好的检测效果。

A detection method and device of malicious code in web page

【技术实现步骤摘要】
一种网页中携带恶意代码的检测方法和装置
本专利技术涉及互联网
,特别是涉及一种网页中携带恶意代码的检测方法和装置。
技术介绍
网页挂马是一种通俗的叫法,是指网页形式的恶意代码。网页恶意代码具体来说又分为两类,一类是通过修改原来的网页,把原来正常功能的网页变成了带有恶意功能的网页,这种修改包括但不限于:增加或修改网页的标题,meta字段,Javascirpt代码,Iframe标签等等。另外一类是指网页后门类,也叫做webshell,这种类型的恶意网页不是在原来的网页基础上修改得来的,而是全部内容都是黑客提供的恶意代码,是一个单独的文件。对于第一种类型,有两种常用的利用方式,一是黑帽SEO(全称为:SearchEngineOptimization),二是浏览器漏洞利用。黑帽SEO本质上是利用黑客技术手段来欺骗搜索引擎,让本来不应该出现的网站网址出现在搜索引擎的检测结果页面上,这样一来,用户就可以在搜索引擎上搜索到相关的非法网站网址。对于黑帽SEO,技术实现方式多种多样,一些常见的方法如暗链、关键词堆砌、蜘蛛欺骗、寄生虫技术等等本文档来自技高网...

【技术保护点】
1.一种网页中携带恶意代码的检测方法,其特征在于,包括:/n使用搜索引擎爬虫的User-agent,赋值第一网址请求消息中的User_agent字段后,向待检测网页的地址发送第一网址请求消息;/n接收所述待检测网页返回的第一响应消息,并存储所述响应消息中携带的网页标题、正文内容、HTML标签中的一项或者多项;/n使用普通终端用户的User-agent,赋值第二网址请求消息中的User_agent字段后,向待检测网页的地址发送第二网址请求消息;/n接收所述待检测网页返回的第二响应消息,并存储所述响应消息中携带的网页标题、正文内容、HTML标签中的一项或者多项;/n匹配所述第一响应消息和第二响应消...

【技术特征摘要】
1.一种网页中携带恶意代码的检测方法,其特征在于,包括:
使用搜索引擎爬虫的User-agent,赋值第一网址请求消息中的User_agent字段后,向待检测网页的地址发送第一网址请求消息;
接收所述待检测网页返回的第一响应消息,并存储所述响应消息中携带的网页标题、正文内容、HTML标签中的一项或者多项;
使用普通终端用户的User-agent,赋值第二网址请求消息中的User_agent字段后,向待检测网页的地址发送第二网址请求消息;
接收所述待检测网页返回的第二响应消息,并存储所述响应消息中携带的网页标题、正文内容、HTML标签中的一项或者多项;
匹配所述第一响应消息和第二响应消息中所携带的,所述网页标题、正文内容、HTML标签中的一项或者多项,若匹配结果差异性大于预设条件,则将所述待检测网页标定为潜在携带恶意代码的网站。


2.根据权利要求1所述的网页中携带恶意代码的检测方法,其特征在于,所述匹配所述第一响应消息和第二响应消息中所携带的,所述网页标题、正文内容、HTML标签中的一项或者多项,若匹配结果差异性大于预设条件,则将所述待检测网页标定为潜在携带恶意代码的网站,具体包括:
匹配所述第一响应消息和第二响应消息中所携带的网页标题,若匹配结果为不完全相同,则将所述待检测网页标定为潜在携带恶意代码的网站;
其中,匹配结果差异性大于预设条件,具体为所述若匹配结果为不完全相同。


3.根据权利要求2所述的网页中携带恶意代码的检测方法,其特征在于,所述待检测网页标定为潜在携带恶意代码的网站之后,所述方法还包括:
根据匹配出的第一响应消息和第二响应消息中所携带的网页标题中的差异性字节,与非法网站关键词库进行匹配,若匹配成功则将所述潜在携带恶意代码的网站,标注为确信携带恶意代码的网站。


4.根据权利要求2所述的网页中携带恶意代码的检测方法,其特征在于,所述待检测网页标定为潜在携带恶意代码的网站之后,所述方法还包括:
根据匹配出的第一响应消息和第二响应消息中所携带的网页标题中的差异性字节,与非法网站关键词库进行匹配,若匹配不成功则将所述潜在携带恶意代码的网站,标注...

【专利技术属性】
技术研发人员:侯贺明王赟黄华桥程波曾伟谭国权李明栋
申请(专利权)人:武汉绿色网络信息服务有限责任公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1