当前位置: 首页 > 专利查询>孙翔专利>正文

一种通过随机代码注入防止网页数据未经授权抓取的方法技术

技术编号:18399288 阅读:47 留言:0更新日期:2018-07-08 19:42
本发明专利技术公开了一种通过随机代码注入防止网页数据未经授权抓取的方法,其特征在于,包括客户端和WEB服务器,客户端向WEB服务器发出页面访问请求,WEB服务器生成正常的动态页面,动态页面内容生成后利用将内容发送服务器RID模块,生成HTML标签

【技术实现步骤摘要】
一种通过随机代码注入防止网页数据未经授权抓取的方法
本专利技术涉及计算机数据安全领域,具体是一种通过随机代码注入防止网页数据未经授权抓取的方法。
技术介绍
随着计算机信息技术的发展,越来越多的企业建立了自己的网站,这些网站不是一个个信息孤岛,它们之间常常存在一种信息交流,其中有些企业在开发使用第三方数据的企业站点时采取的是谨慎的态度,它们通常的做法是和第三方数据提供者签署书面法律文件并给予对方适当的回报来获得对方数据的访问授权,另一些公司做法正好相反,它们试图在未获取对方许可的情况下免费使用第三方数据;这些公司一般使用自动化网络爬取工具大量爬取它们需要的数据,这种行为严重损坏了第三方公司的合法权益,给对方的网络增加了大量的额外负载。
技术实现思路
本专利技术的目的在于提供一种通过随机代码注入防止网页数据未经授权抓取的方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种通过随机代码注入防止网页数据未经授权抓取的方法,包括客户端和WEB服务器,客户端向WEB服务器发出页面访问请求,WEB服务器生成正常的动态页面,动态页面内容生成后利用将内容发送服务器RID模块,RID模块分析网页,通过判断所读取的文本所属的字符集,然后生成HTML标签<table></table>,再生成<tr></tr>标签对组,生成的<tr></tr>标签对组的数量由RID模块随机确定,生成<tr></tr>标签对组后将该标签对组插入<table></table>之间,RID模块再为每个生成的<tr></tr>标签对生成随机数量的<td></td>标签对组并插入到<tr></tr>标签对之间,最后生成标签集合,RID系统将该标签集合随机插入到预先分析出的网页有效中文字符之间,并将插入后的页面返回给用户客户端。作为本专利技术进一步的方案:所述RID模块丰要包括随机代码生成模块以及随机代码插入模块。作为本专利技术再进一步的方案:所述WEB服务器丰要是由RID模块与动态页面生成模块构成。与现有技术相比,本专利技术的有益效果是:该方法易于实现,易于移植,执行效率高,不影响生成页面的用户体验。因为该方案实现时遵循了HTML、Servlet标准,只要是JEE兼容的WEB容器皆可以直接移植代码模块功能,随机表格标签集生成容易,实现代码简单,系统执行效率高,由于随机表格标签集其实质是一张空表,用户浏览器在渲染用户界面时直接予以忽略,对真正用户的用户体验没有任何影响。附图说明图1为通过随机代码注入防止网页数据未经授权抓取的方法的结构示意图。具体实施方式下面结合具体实施方式对本专利技术的技术方案作进一步详细地说明。请参阅图1,一种通过随机代码注入防止网页数据未经授权抓取的方法,配置好JEE兼容的WEB容器,如Jboss、Glassfish等。网页内容动态生成模块属于JEE兼容WEB容器内建模块,所以该方案只需实现RID模块中的两个子模块,随机代码生成子模块和随机代码注入子模块。这两个子模块遵循TheJavaServletspecificationversion2.3标准,实现filter接口,并且在doFilter方法中实现随机代码生成,随机代码注入功能;首先客户端向WEB服务器发出页面访问请求,请求首先被送到网页内容动态生成模块,网页内容动态生成模块根据用户请求的资源地址URI,生成相应的动态页面,然后动态页面内容被作为HttpResponse内容发送到请求处理链的下一个模块RID模块,RID模块分析网页,通过判断所读取的文本所属的字符集,是否是中文字符来获取有效文本信息所在的位置,然后随机代码生成子模块开始生成HTML标签<table></table>,再生成<tr></tr>标签对组,生成的<tr></tr>标签对组的数量由该子模块随机确定,生成<tr></tr>标签对组后将该标签对组插入<table></table>之间,随机代码生成子模块再为每个生成的<tr></tr>标签对生成随机数量的<td></td>标签对组并并插入到<tr></tr>标签对之间,最后生成类似于<table><tr><td></td></tr><td></td><td></td><tr></tr></table>的标签集合,随机代码注入子模块将该标签集合随机插入到预先分析出的网页有效中文字符之间。HTTPWebServer将注入代码后的动态页面返回给客户端。对于本领域技术人员而言,显然本专利技术不限于上述示范性实施例的细节,而且在不背离本专利技术的精神或基本特征的情况下,能够以其他的具体形式实现本专利技术。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本专利技术的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本专利技术内。此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。本文档来自技高网...

【技术保护点】
1.一种通过随机代码注入防止网页数据未经授权抓取的方法,其特征在于,包括客户端和WEB服务器,客户端向WEB服务器发出页面访问请求,WEB服务器生成正常的动态页面,动态页面内容生成后利用将内容发送服务器RID模块,RID模块分析网页,通过判断所读取的文本所属的字符集,然后生成HTML标签

【技术特征摘要】
1.一种通过随机代码注入防止网页数据未经授权抓取的方法,其特征在于,包括客户端和WEB服务器,客户端向WEB服务器发出页面访问请求,WEB服务器生成正常的动态页面,动态页面内容生成后利用将内容发送服务器RID模块,RID模块分析网页,通过判断所读取的文本所属的字符集,然后生成HTML标签<table></table>,再生成<tr></tr>标签对组,生成的<tr></tr>标签对组的数量由RID模块随机确定,生成<tr></tr>标签对组后将该标签对组插入<table>&lt...

【专利技术属性】
技术研发人员:孙翔
申请(专利权)人:孙翔
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1