一种基于网络协议实施监控网页访问的方法技术

技术编号:14481803 阅读:64 留言:0更新日期:2017-01-25 23:31
本发明专利技术公开了一种基于网络协议实施监控网页访问的方法,其特征在于包括以下步骤:S1:通过监控路由器,实现网页请求数据包采集,收集网络数据中的网页请求数据包;S2:网页请求数据包解析,获取httpHost值和网络路径值;S3:请求返回包采集,收集网络数据中的网页请求返回包;S4:请求返回包解析,获取获取返回内容长度和返回内容,并将其写入缓存;S5:网页请求封装,将网络请求与返回的值进行整合,获得网页的内容。本发明专利技术的有益效果如下:1、无需安装客户端,方便且隐蔽;2、通过抓取、解析路由器上收发的网络数据包实现监控,保护隐私数据的信息安全;3、可以获取被监控的设备中所浏览的所有网页记录,准确高效。

【技术实现步骤摘要】

本专利技术涉及信息安全
,特别涉及一种基于网络协议实施监控网页访问的方法
技术介绍
随着科技的发展,人们对网络的依赖也越来越大,网络泄密问题也随之显现出来,各大公司,各种部门也不得不对职员的网络使用情况进行管控,防止职员泄露机密信息。目前市面上也有很多的网络管控工具,大多数都是对电脑进行管控,且需在电脑上安装客户端,由客户端收集数据发送到监控端实现监控。这种方式就必然会有以下问题:1:客户端被卸载或禁用后就不会再起到监控作用;2:由于客户端需要在后台运行,不断向服务器发送数据必然会使耗电量增大,显然在移动设备上是不适用的。
技术实现思路
本专利技术针对现有技术的缺陷,提供了一种基于网络协议实施监控网页访问的方法,能有效的解决上述现有技术存在的问题。一种基于网络协议实施监控网页访问的方法,包括以下步骤:S1:通过监控路由器,实现网页请求数据包采集,收集网络数据中的网页请求数据包;S2:网页请求数据包解析,获取httpHost值和网络路径值;S3:请求返回包采集,收集网络数据中的网页请求返回包;S4:请求返回包解析,获取获取返回内容长度和返回内容,并将其写入缓存;S5:网页请求封装,将网络请求与返回的值进行整合,获得网页的内容。作为优选,所述S1的详细步骤如下:S11:通过第三方API提供的相应接口抓取用户使用网络过程中产生的数据包,再通过浏览器的协议类型、端口号、Host和网络请求地址进行过滤,若发现对应数据包则记录起来;S12:获取HTTP请求的Accept值,从记录的数据包中扫描特征“Accept:”到“0D0A”截取字符串即为Accrpt值;S13:判断请求是否为网页请求,若Accept值中包含“text/html”则为网页请求,执行S2;否则表示不是网页请求,结束解析。作为优选,所述S2的详细步骤如下:S21:httpHost解析,从数据包中的“Host:”到“0D0A”截取的字符串即为httpHost值;S22:网络路径解析,从数据包中的“GET”到“HTTP/1.1”截取的字符串即为网络路径值。作为优选,所述S3的详细步骤如下:S31:通过第三方API提供的相应接口抓取用户使用网络过程中产生的数据包,再通过返回包协议类型:TCP-HTTP和端口号:80,找到相应数据包并开始记录;S32:获取返回内容类型,从数据包中的“Content-Type:”到第一个“;”截取字符串即为返回内容类型;S33:判断返回内容类型是否为“text/html”,若是则是网页类型,执行S4;不是则结束解析。作为优选,所述S4的详细步骤如下:S41:获取返回内容长度命名为length;从http消息头“0D0A0D0A”位置后为返回内容长度的十六进制字符串值,该字符串以“0D0A”结束,通过转换方法得到返回内容十进制长度值记为length;S42:获取返回内容,从内容长度向后获取length个字节为返回内容;S43:将返回内容写入到缓存;将内容进行解压,又因解压gz压缩内容的系统库只提供了对gz文件的解压操作,所以需将内容写入到一个后缀名为“.gz”的文件中;S44:解压文件,调用系统库直接对上一步保存的缓存文件进行解压,解压后得到一个网页文件即html文件,并将该html存储到指定路径;S45:解析文件,调用库函数对html文件进行解析,根据网页的标签属性获取对应的内容。作为优选,所述S5的详细步骤如下:S51:申请一个全局对象缓存获取到的数值列表;S52:获取网络请求数据包的本地端口号,通过第三方API的相应接口可获取到网络请求数据包的本地端口号;S53:网络请求数据包校验取值;将本地端口号做为key在缓存列表中查找是否存在数值,该数值应为S44得到的html文件路径和S45获取到的title值,若是则将该值与S2获取到的httpHost和网络路径组合起来即为一个完整的网页访问数据;若不是则执行S54;S54:若S53判断数值不存在,则将S2获取到的httpHost和网络路径以本地端口号为key存储到缓存列表中;S55:获取网络请求返回包的本地端口号,通过第三方API的相应接口可获取到网络请求返回包的本地端口号;S56:网络请求返回包校验取值;将本地端口号做为key在缓存列表中查找是否存在数值,该数值应为S2获取到的httpHost和网络路径,若是则将该值与S44得到的html文件路径和S45获取到的title值组合起来即为一个完整的网页访问数据;若不是则执行S57;S57:若S55判断数值不存在,则将S44得到的html文件路径和S45获取到的title值以本地端口号为key存储到缓存列表中。与现有技术相比本专利技术的优点在于:1、无需安装客户端,方便且隐蔽;2、通过抓取、解析路由器上收发的网络数据包实现监控,保护隐私数据的信息安全;3、可以获取被监控的设备中所浏览的所有网页记录,准确高效。具体实施方式为使本专利技术的目的:技术方案及优点更加清楚明白,以下举实施例,对本专利技术做进一步详细说明。一种基于网络协议实施监控网页访问的方法,包括以下步骤:S1:网页请求数据包采集;S11:通过第三方API提供的相应接口抓取用户使用网络过程中产生的数据包,再通过浏览器的协议类型、端口号、Host和网络请求地址进行过滤,若发现对应数据包则记录起来;S12:获取HTTP请求的Accept值,从记录的数据包中扫描特征“Accept:”到“0D0A”截取字符串即为Accrpt值;S13:判断请求是否为网页请求,若Accept值中包含“text/html”则为网页请求,执行S2;否则表示不是网页请求,结束解析。S2:网页请求数据包解析;S21:httpHost解析,从数据包中的“Host:”到“0D0A”截取的字符串即为httpHost值;S22:网络路径解析,从数据包中的“GET”到“HTTP/1.1”截取的字符串即为网络路径值。S3:请求返回包采集;S31:通过第三方API提供提供的相应接口抓取用户使用网络过程中产生的数据包,再通过返回包协议类型:TCP-HTTP和端口号:80,找到相应数据包并开始记录;S32:获取返回内容类型,从数据包中的“Content-Type:”到第一个“;”截取字符串即为返回内容类型;S33:判断返回内容类型是否为“text/html”,若是则是网页类型,执行S4;不是则结束解析。S4:请求返回包解析;S41:获取返回内容长度命名为length;从http消息头“0D0A0D0A”位置后为返回内容长度的十六进制字符串值,该字符串以0D0A结束,通过转换方法及可得到返回内容十进制长度值记为length;S42:获取返回内容,从内容长度向后获取length个字节为返回内容;S43:将返回内容写入到缓存;由于返回内容是通过gz压缩后传输的,所以需要将内容进行解压,又因解压gz压缩内容的系统库只提供了对gz文件的解压操作,所以需将内容写入到一个后缀名为“.gz”的文件中;S44:解压文件,调用系统库直接对上一步保存的缓存文件进行解压,解压后得到一个网页文件即html文件,并将该html存储到指定路径(存储至硬盘);S45:解析文件,调用库函数对html文件进行解析,根据网页的标签属性获取对应的内本文档来自技高网...

【技术保护点】
一种基于网络协议实施监控网页访问的方法,其特征在于包括以下步骤:S1:通过监控路由器,实现网页请求数据包采集,收集网络数据中的网页请求数据包;S2:网页请求数据包解析,获取httpHost值和网络路径值;S3:请求返回包采集,收集网络数据中的网页请求返回包;S4:请求返回包解析,获取获取返回内容长度和返回内容,并将其写入缓存;S5:网页请求封装,将网络请求与返回的值进行整合,获得网页的内容。

【技术特征摘要】
1.一种基于网络协议实施监控网页访问的方法,其特征在于包括以下步骤:S1:通过监控路由器,实现网页请求数据包采集,收集网络数据中的网页请求数据包;S2:网页请求数据包解析,获取httpHost值和网络路径值;S3:请求返回包采集,收集网络数据中的网页请求返回包;S4:请求返回包解析,获取获取返回内容长度和返回内容,并将其写入缓存;S5:网页请求封装,将网络请求与返回的值进行整合,获得网页的内容。2.根据权利要求1所述的一种基于网络协议实施监控网页访问的方法,其特征在于所述S1的详细步骤如下:S11:通过第三方API提供的相应接口抓取用户使用网络过程中产生的数据包,再通过浏览器的协议类型、端口号、Host和网络请求地址进行过滤,若发现对应数据包则记录起来;S12:获取HTTP请求的Accept值,从记录的数据包中扫描特征“Accept:”到“0D0A”截取字符串即为Accrpt值;S13:判断请求是否为网页请求,若Accept值中包含“text/html”则为网页请求,执行S2;否则表示不是网页请求,结束解析。3.根据权利要求2所述的一种基于网络协议实施监控网页访问的方法,其特征在于所述S2的详细步骤如下:S21:httpHost解析,从数据包中的“Host:”到“0D0A”截取的字符串即为httpHost值;S22:网络路径解析,从数据包中的“GET”到“HTTP/1.1”截取的字符串即为网络路径值。4.根据权利要求3所述的一种基于网络协议实施监控网页访问的方法,其特征在于所述S3的详细步骤如下:S31:通过第三方API提供的相应接口抓取用户使用网络过程中产生的数据包,再通过返回包协议类型:TCP-HTTP和端口号:80,找到相应数据包并开始记录;S32:获取返回内容类型,从数据包中的“Content-Type:”到第一个“;”截取字符串即为返回内容类型;S33:判断返回内容类型是否为“text/html”,若是则是网页类型,执行S4;不是则结束解析。5.根据权利要求4所述的一种基于网络协议实施监控网页访问的方法,其特征在于所述S4...

【专利技术属性】
技术研发人员:黄旭雷珂
申请(专利权)人:四川秘无痕信息安全技术有限责任公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1