网页访问者身份识别方法及系统技术方案

技术编号：8107802 阅读：266 留言：0更新日期：2012-12-21 08:08

本申请提供了一种网页访问者身份识别方法，包括：当访问者对具有虚拟页面资源的必要页面提出访问请求时，存储访问者对必要页面的虚拟页面资源的访问信息；接收访问者对目标页面的访问请求；读取存储的所述访问者对必要页面中虚拟页面资源的访问信息；如果能够读取到所述访问信息，则访问者属于合法访问者，对访问者的访问请求给出反馈，反之，则访问者属于非法访问者，跳转到必要页面要求访问者对必要页面进行访问。本申请还提供一种实现前述方法的网页访问者身份识别系统。本申请的网页访问者身份识别方法及系统，能够识别出访问者身份，并且能够有效的防范非法访问者，且具有较好的隐蔽性，以避免被非法访问者检测到，提高系统的安全性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机网络安全
，特别是涉及一种网页访问者身份识别方法和系统。
技术介绍
随着网络技术的不断发展，搜索引擎得到了不断的完善，通过搜索引擎可以从互联网上获取各种信息。从搜索引擎技术发展而来的爬虫技术可以根据既定的抓取目标，有选择的访问网页与相关的链接，从而获取所需要的信息。随着爬虫技术的发展，爬虫类软件越来越多的被应用于生活中，使网站信息不断被抓取。目前，已经有爬虫类软件被用于非诚信的交易操作，影响系统的安全性。如秒杀器、下单器等常见的爬虫类软件，通过模拟浏览器请求提交参数到服务器端，把原本用户行为的操作用程序机器行为替代，从而进行一些非诚信的交易操作。通常情况下，在进行某些操作时，用户需要首先访问某一必要页面，然后通过该必要页面到达目标页面，为了节省时间和提交效率，爬虫软件通常不会象浏览器那样请求所有页面资源，等待用户手动交互，而是将用户的行为直接事先拼凑好参数，用程序代替直接到浏览器的目标页面进行提交。为了防止爬虫软件等非法访问者跨过必要页面向目标页面进行提交，通常做法是在服务端对该必要页面的请求进行日志记录，在提交到目标页面时检测日志记...

【技术保护点】
一种网页访问者身份识别方法，其特征在于，包括以下步骤：当访问者对具有虚拟页面资源的必要页面提出访问请求时，存储访问者对必要页面的虚拟页面资源的访问信息；接收访问者对目标页面的访问请求；读取存储的所述访问者对必要页面中虚拟页面资源的访问信息；如果能够读取到所述访问者对必要页面中虚拟页面资源的访问信息，则访问者属于合法访问者，对访问者的访问请求给出反馈，反之，则访问者属于非法访问者，跳转到必要页面要求访问者对必要页面进行访问。

【技术特征摘要】
1.一种网页访问者身份识别方法，其特征在于，包括以下步骤当访问者对具有虚拟页面资源的必要页面提出访问请求时，存储访问者对必要页面的虚拟页面资源的访问信息；接收访问者对目标页面的访问请求；读取存储的所述访问者对必要页面中虚拟页面资源的访问信息；如果能够读取到所述访问者对必要页面中虚拟页面资源的访问信息，则访问者属于合法访问者，对访问者的访问请求给出反馈，反之，则访问者属于非法访问者，跳转到必要页面要求访问者对必要页面进行访问。2.如权利要求I所述的方法，其特征在于，所述方法还包括所述访问者请求访问必要页面时，对所述虚拟页面资源的访问请求早于对所述必要页面中的点击按钮所对应的页面资源的访问请求。3.如权利要求2所述的方法，其特征在于，所述方法还包括所述访问者请求访问必要页面时，首先提出对所述虚拟页面资源的访问请求。4.如权利要求I所述的方法，其特征在于，所述方法还包括在当访问者对具有虚拟页面资源的必要页面提出访问请求时，存储访问者对必要页面的虚拟页面资源的访问信息之前增加如下步骤设置虚拟...

【专利技术属性】
技术研发人员：彭渊，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人