一种防止博客被网络爬虫检索的方法和装置制造方法及图纸

技术编号：15841348 阅读：50 留言：0更新日期：2017-07-18 16:59

本申请公开了一种防止博客被网络爬虫检索的方法和装置。该方法在接收到访客的访问请求后，对博客的页码进行加密以生成与该页码对应字符串，并根据生成的字符串生成该页码对应的网络链接中。由于该字符串是通过加密方式生成的，因而访客只能通过点击博客页码实现对博客页面的访问，而无法利用网络爬虫实现对页面网络链接的拼接，从而防止了网络爬虫对博客的大量检索。

Method and device for preventing blog from being retrieved by network crawler

The present invention discloses a method and a device for preventing blog from being retrieved by web crawler. After receiving the visitor's access request, the method encrypts the page number of the blog to generate the corresponding string of the page number, and generates the corresponding network link according to the generated string. Because the string is generated by the method of encryption, so that visitors can only click through to the blog to blog page page access, unable to use web crawler to stitch the page link, thereby preventing a lot of Blog search web crawler.

全部详细技术资料下载

【技术实现步骤摘要】
一种防止博客被网络爬虫检索的方法和装置
本申请涉及网络信息管理领域，更具体地说，涉及一种防止博客被网络爬虫检索的方法和装置。
技术介绍
在这个信息时代，数据资源显得格外重要。网络爬虫该类的脚本程序使得检索网络信息资源变得更加方便。许多网站上的资源很容易被人给检索过去。以博客为例子，博客入驻了很多知名的名家，每个博主都拥有较多的文章。这时候其他小网站的要搜集这些资源只要一个写一个网络爬虫的脚本，该网络爬虫脚本可根据博客某文章列表分页的URL进行修改页码拼接得到所有文章列表分页的URL，就能加载所有博客文章的内容一次把文章给复制过去，显然，这对于网络公司来说很不利。在现在一般防止被爬虫的方法一般是通过限制IP的访问，比如一个IP一秒钟内不能连续加载两个文章内容或者文章页列表，或者写一个脚本，把一些经常用来检索数据的IP给加入黑名单，限制访问，但是这样的效果并不好，尽管做了时间限制，然后别人每次延迟加载一秒钟，照样可以完整的爬取内容。所以，这时候需要有更好的防止网络爬虫的方法。
技术实现思路
有鉴于此，本申请提供一种防止博客被网络爬虫检索的方法和装置，以防止博客被网络爬虫检索。为了实现上述目的，现提出的方案如下：一种防止网络博客被网络爬虫检索的方法，包括：接收访客发送的访问请求；基于预设加密算法对博客的所有页码进行加密生成与所述页码对应的字符串；根据所述字符串生成所述页码对应的网络链接，所述网络链接中包含所述字符串；允许访客访问博客主页。优选的，所述将所述字符串添加到所述页码对应的网络链接中，之后还包括：保存所有页码对应的包含有所述字符串的网络链接。优选的，当所述字...
一种防止博客被网络爬虫检索的方法和装置

【技术保护点】
一种防止网络博客被网络爬虫检索的方法，其特征在于，包括：接收访客发送的访问请求；基于预设加密算法对博客的所有页码进行加密生成与所述页码对应的字符串；根据所述字符串生成所述页码对应的网络链接，所述网络链接中包含所述字符串；允许访客访问博客主页。

【技术特征摘要】
1.一种防止网络博客被网络爬虫检索的方法，其特征在于，包括：接收访客发送的访问请求；基于预设加密算法对博客的所有页码进行加密生成与所述页码对应的字符串；根据所述字符串生成所述页码对应的网络链接，所述网络链接中包含所述字符串；允许访客访问博客主页。2.根据权利要求1所述的方法，其特征在于，所述根据所述字符串生成所述页码对应的网络链接，之后还包括：保存所有页码对应的包含有所述字符串的网络链接。3.根据权利要求2所述的方法，其特征在于，当所述字符串的存在时长超出了预设有效期后，生成新字符串，并根据所述新字符串对所述页码对应的网络链接进行更新。4.根据权利要求1所述的方法，其特征在于，所述预设加密算法包括：利用UUID唯一识别码当做当前页码进行对页码加密。5.一种防止网络博客被网络爬虫检索的装置...

【专利技术属性】
技术研发人员：沈文策，
申请(专利权)人：福建中金在线信息科技有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人