基于图片的网页文本保护方法技术

技术编号:3784386 阅读:311 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种基于图片的网页文本保护的网络安全方法。主要解决现有网页文本保护方法传输量大,安全性差的问题。在服务器端,随机打乱文本次序,并选取乱序后文本中的小部分文字,生成图片,然后将文本中的剩余文字及每个字的坐标信息进行加密,连同图片一起传输到客户端。在客户端将传输来的图片作为背景图片,而加密后的信息,则由客户端解密,解密后所得文本信息中的每个文字,由客户端生成相应的一张小图片,并按照该文字在原始文本中的位置,将此小图片叠加到背景图片的适当位置上,从而得到包含整个文本信息的图片,并显示到浏览器中。本发明专利技术使文本复制得到控制,可有效地保护作者的版权和利益。

【技术实现步骤摘要】

本专利技术属于计算机网络
,涉及网页的文本保护方法,用于电脑、手机等各 种信息设备的文本保护。
技术介绍
随着电脑、手机等信息设备的普及,网络文学作品也越来越成为一种趋势。很多 网络文学作品发布网站为了保护作者的版权和利益,需要用户付费才能够阅读该网站的作品。但对于这些付费文学作品网站来说,只要某一读者付费进入之后,通过查看页面 源代码,甚至仅仅通过“复制一粘贴”页面文本,就可以轻轻松松地把这些文学作品内容 转载到别的网页中,更多时候转载到自己的博客空间中。这样很多想要阅读这些文学作品 的人,不需要进入相关的收费网站,而仅仅访问这些空间就可以阅读文学作品了。这对于读 者提供了极大方便,可以免费阅读这些作品。但对于这些收费网站来说,不仅损害了文学作 品作者的权益,而且也让他们的收益大大减少。目前各大网站大都采用图片的方式来进行文本保护,即作者在网上提交作品后, 服务器端生成图片,然后用户浏览时将生成好的图片传送到客户端。该技术能较好的对文 本进行保护,但缺点是图片要比文本大的多,导致网络传输量大大增加,为用户浏览尤其是 手机用户浏览带来了极大不便。另外虽然也有一些从事安全方面研究的人提出了很多方 法来保护这些文本,例如,在浏览器中装入打乱页面次序的插件,这样,当读者想要通过查 看页面源代码来获取文本时,看到的只是乱序后的文本,从而给以往的“复制——粘贴”文 本的方法,带来了一个的困难,但这仅仅是治标不治本。读者只要稍有编程知识,就可以很 容易地分析出这些文本乱序的算法,此时,只要再以相同的做法,“以其人之道还治其人之 身”,将插件的功能逆转过来,就可以很方便地还原出页面文本。随着信息技术的不断发展,如何保护网站的收益不受损害,而且网络文学作品作 者的权益也不受到侵害,已经越来越受关注。
技术实现思路
本专利技术目的在于克服现有对网页文本保护方法的传输量大,安全性差的不足,提 出了一种,以防止用户获取和传播页面文本的内容,有效地 保护网络文学作品作者的版权和利益,同时减少网站的损失。为了实现上述目的,本专利技术提供的文本保护方法,包括(1)在Web服务器端获取文本内容,打乱文本次序;(2)随机选取文本中的小部分内容,生成图片;(3)将文本中未生成图片的剩余内容,与每一个文字相应的坐标信息一起加密,并 压缩;(4)将压缩后的信息,以及所生成的图片保存到html页面中,传输给客户端;(5)客户端接收到html页面后,获取其中的图片,作为背景图片,并对接收到的压缩信息进行解压及解密,还原出原始信息;(6)客户端将还原的原始信息中的每个文字解释成像素,生成一张仅包含该文字 的小图片,并根据该文字的坐标信息,将图片叠加到背景图上,最终将包含完整文字信息的 整个页面显示给用户。本专利技术具有如下优点1)本专利技术由于随机选取文本中小部分内容生成图片,减少了传输时的信息量;2)本专利技术由于将文本乱序,并将文本剩余内容及坐标加密压缩,使传输过程中信 息截获后的恢复变得困难,同时,有效防止了通过查看页面源代码来获取文本;3)本专利技术由于在背景图中加入干扰信息及标准字库中的字体等内容,有效的防止 OCR识别,进一步保护网页文本内容;4)本专利技术由于将文本剩余的每个文字解释成像素,有效防止通过“复制-粘贴”获 取传播页面文本的内容。附图说明图1是现有浏览器服务器端与客户端交互图;图2是本专利技术在服务器端处理文本的流程图;图3是本专利技术在客户端处理文本的流程图。图4是本专利技术实验实例中服务器端随机选取文本小部分字符生成的图片; 图5是本专利技术实验实例中客户端生成的“御”字对应的文字图片; 图6是本专利技术实验实例中客户端最终生成的文字图片。具体实施例方式下面结合附图和具体实施来进一步说明本专利技术实施的技术方案。图1为web浏览器工作的基本原理图。上半部分表示客户机与服务器交互的关系; 下半部分图示则表示浏览器与web服务器交互的关系。其中,浏览器首先向web服务器发 出请求,web服务器对请求做出响应,将响应数据发送给客户端浏览器,通常是html文件, 然后通过浏览器把html文件信息显示到用户端屏幕上。这是最基本的网络应用原理。其 中的web服务器处理模块,将对文本进行处理,生成客户端合成图片所需的像素信息。参照图2,本专利技术在服务器端的工作流程包括如下步骤步骤1,在Web服务器端获取文本内容,打乱文本次序。当用户发出URL请求,要浏览某个web页面的文学作品内容时,浏览器将该请求发 送到服务器端。服务器端接收到该请求后,查找用户所要浏览的网页以及该页面中包含的 文学作品内容。根据得到的信息,提取出文学作品内容,为了增加文本保护的安全级别,对 文本进行乱序操作。该乱序操作是依据用户账户、登录时间和IP地址作为随机种子,打乱 文本的原始次序。步骤2,随机选取文本中的小部分内容,生成图片。从乱序后的文本中,随机选取小部分内容,并随机从浏览器服务器端字库中选取 出某种字体,生成所选取内容的像素信息,合成图片。其中,为了阻碍OCR识别,在生成像素的过程中,添加了 一些图像加噪声等干扰因 素。具体来说,在生成像素信息的过程中,适当地加入背景像素点、干扰像素点、噪声线,以 及对文字添加阴影、变字体、加入标准字库中的字,以及适当地加入自造字体库中的字体。步骤3,将文本中未生成图片的剩余内容,与每一个文字相应的坐标信息一起加 密,并压缩。为了保证在客户端还原原始文本时,准确地知道每个文字的位置,在乱序前需要 记录下每个文字在原始文本中的坐标。首先,获取剩余文本及其中每个文字在所生成图片中的像素坐标信息,为了保证 传输的安全行,需要对此信息进行加密;然后,对于加密后的信息,又进一步进行压缩,再传 输,从而提高了传输效率,方便读者阅读。根据浏览器的工作特性,要保证效率,就要使得大部分工作在浏览器客户端完成, 而另一方面,为了提高网络传输的安全性,又要求服务器端采取一定的措施。因而,为了兼 顾网络传输效率以及网络传输的安全,采取小部分文本作为图片传输,大部分用文本传输 的措施,使得这两者可以得到更好的结合。步骤4,将压缩后的信息,以及所生成的图片保存到html页面中,传输给客户端。将需要生成的图片,以及加密压缩之后的敏感信息写入到html页面,并进一步传 输到客户端浏览器,通过该处理,在网络传输的过程中,即使所传输的html页面被截获,所 得到的也只不过是一张包含文本中小部分文字的图片和加密压缩后的被打乱次序的文字 信息以及坐标信息,因此上述将压缩后的信息,以及所生成的图片先保存到html页面中, 再传输给客户端的这种处理方法可以有效的保护页面文本。参考图3,本专利技术在浏览器的处理流程包括如下步骤步骤A,接收到服务器端发送的html页面,解析出其中的关键信息。客户端浏览器一旦接收到web服务器发送过来的html信息,就会对页面内容进行 分析,解析出网页中的关键敏感信息,这些信息包括生成的图片信息,加密压缩的剩余文本 信息和坐标信息。步骤B,获取图片作为背景图片。根据步骤A中获得的信息,提取出其中的图片,该图片即为服务器端步骤2所生成 的带有小部分文字及防止OCR识别的干扰信息的图片,将图片作为客户端页面中的背景图 片。步骤C,获取其中的剩余文字信息,将其进行解压并解密。根据本文档来自技高网
...

【技术保护点】
一种基于图片的网页文本保护方法,包括如下步骤:(1)在Web服务器端获取文本内容,打乱文本次序;(2)随机选取文本中的小部分内容,生成图片;(3)将文本中未生成图片的剩余内容,与每一个文字相应的坐标信息一起加密,并压缩;(4)将压缩后的信息,以及所生成的图片保存到html页面中,传输给客户端;(5)客户端接收到html页面后,获取其中的图片,作为背景图片,并对接收到的压缩信息进行解压及解密,还原出原始信息;(6)客户端将还原的原始信息中的每个文字解释成像素,生成一张包含该文字的小图片,并根据该文字的坐标信息,将图片叠加到背景图上,最终将包含完整文字信息的整个页面显示给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:王黎明李晓东刘西洋秦英姚丹
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1