当前位置: 首页 > 专利查询>李晓妮专利>正文

一种网页文档水印嵌入的方法和装置制造方法及图纸

技术编号:22330499 阅读:48 留言:0更新日期:2019-10-19 12:21
本发明专利技术涉及一种网页文档水印嵌入的方法和装置。该方法包括:步骤一,用户登录网络浏览器访问Web应用系统页面时,截获Web应用的HTTP协议数据包;步骤二,对截获到的HTTP协议数据包中的HTTP响应头数据包进行解析,获取HTTP响应内容数据;步骤三,对HTTP响应内容数据进行解析,通过修改页面内容数据嵌入水印信息;步骤四,将嵌入水印后的页面文件返回给浏览器进行正常的页面内容解析和页面内容渲染。本发明专利技术中嵌入的文本溯源追踪信息视觉不可见,避免了现有的屏幕显性水印技术带来的视觉干扰;同时水印信息是通过网页文档中的文字内容为载体嵌入的,不易被手工擦除,并且可以抵抗屏幕拍照或者截屏,因此安全性能较高。

A method and device of embedding web document watermark

【技术实现步骤摘要】
一种网页文档水印嵌入的方法和装置
本专利技术属于数字水印和信息隐藏
,涉及一种网页文档水印嵌入的方法和装置。
技术介绍
随着电子政务、电子商务以及无纸化办公技术的不断发展和快速推进,各类网络应用系统得到了普遍推广应用。比如在移动办公方面,人们已经利用智能终端实现办公人员与企业现有OA办公系统、资产系统、生产管理系统、营销管理系统等各类应用无缝集成,通过移动终端设备实现随时随地能进行企业办公,例如通知、新闻、重大事项、文件等的浏览、短信收发及移动查询等等。网络应用系统极大地提升了信息的流转处理效率,同时也存在着诸多信息泄漏隐患,比如:对电子文件和应用系统页面中敏感信息的打印、复印、屏幕截屏、屏幕拍照等行为。目前,国内外针对通过屏幕拍照、屏幕截屏等方式进行数据泄密的安全防护方法研究主要包括:1.屏幕明水印。在屏幕上显示可见的明水印信息以达到警告和警示的目的。所谓明水印是通过文字信息展现水印的一种方式,比如在网页文档上显性地展示“禁止拍屏”或者把用户信息以明文的方式显示在电脑屏幕中。这是目前应用最为广泛的屏幕信息防泄密方法。2.屏幕二维码。通过二维码的形式展现水印信息。水印默认隐藏在屏幕右下角的二维码图像块中,二维码块可以通过微信或者其它二维码扫描工具进行扫描,扫描后即可弹出所配置的数字水印内容。3.屏幕矢量点阵水印。在屏幕显示不太明显的点阵,通过点阵间的排列方式代表水印信息。实际为一种“轻微型”标记的方式来展现水印,近乎等同于“隐形水印”。如果有屏幕拍照或者截屏,一旦发生泄密事件,即可通过泄密照片上的矢量水印信息快速锁定泄密者。而对于打印,还增加了水印审计信息,不仅可以事后根据打印纸张上的不规则水印锁定泄密者,还可以事先发现“违规”打印审计信息,预先防止。4.叠加图片水印。在屏幕显示的网页文档图像中叠加显示额外的可见的图片文件,所有的水印信息嵌入到图片文件中。可通过调整图片的大小、颜色与位置,将视觉影响度降最低。可自主调整图片的透明度、图片水印拉伸模式和图片水印位置等等。综上所述,目前国内外的一些研究机构和产品厂商主要是基于屏幕明水印和矢量点阵的方式实现网页文档屏幕水印信息的嵌入和提取,但是所有技术都存在着如下的技术问题:1.水印是可见的,视觉效果较差。不论是屏幕明水印或者矢量点阵的方式都是视觉可见的,类似电脑屏幕上蒙了一层额外的“轻”底纹。如果想抵抗更强的攻击操作,文档视觉效果的修改程度会比较大。2.安全性较低,极易被手工擦除。由于水印信息是可见的,可以很容易使用PS工具去除掉,因此水印信息的安全性相对较低。3.不能抵抗二次或多次翻拍。不能有效抵抗任意角度、曝光度不均、远距离、以及摩尔纹干扰等拍摄条件下的水印攻击方式。对于承载着大量敏感个人信息、商业秘密信息、涉及国家秘密信息的应用系统,亟需更为先进的技术手段进行防护,在不影响现有用户体验和应用系统处理的情况下,有效地威慑和追溯信息泄漏的行为。
技术实现思路
本专利技术提供一种网页文档水印嵌入的方法和装置,在视觉不可见的前提下,通过对网页文档的内容解析获取必要的页面文本内容,并利用数字水印算法修改页面文本内容来嵌入水印信息,用以解决现有技术中页面水印的视觉效果差、安全性低以及抗翻拍能力弱等问题。本专利技术的构思在于:首先,当用户在浏览器中输入网址访问网络应用系统页面时,根据服务端下发的策略,对指定Web应用的HTTP协议数据进行拦截;对截获到的HTTP响应头数据包进行解析,从而过滤筛选得到HTML和css(CascadingStyleSheets)格式数据文件;通过对HTML和css类型的页面数据解析,获取页面内容显示的文本内容属性信息,比如字体类型和字体大小等;通过基于矢量字库替换的文本水印算法修改HTML页面文件数据嵌入水印信息;最后,将修改后的HTML页面文件返回给浏览器进行正常的内容解析和页面渲染。从而得到了一种网页文档水印嵌入的方法和装置。本专利技术中一种网页文档页面水印的嵌入方法,技术方案中包括如下步骤:步骤一,用户登录网络浏览器访问Web应用系统页面时,通过数据拦截方式截获Web应用的HTTP协议数据包;步骤二,对截获到的HTTP协议数据包中的HTTP响应头数据包进行解析,获取HTTP响应内容数据;步骤三,对HTTP响应内容数据进行解析,通过修改页面内容数据嵌入水印信息;步骤四,将嵌入水印后的页面文件返回给网络浏览器进行正常的页面内容解析和页面内容渲染。较佳地,所述的HTTP协议数据包,具体内容包括:响应行、响应头和响应体。较佳地,所述的数据拦截方式,包括客户端HOOK方式和服务器代理拦截方式。较佳地,所述的数据拦截,数据拦截的时机按照页面载入的过程分为页面加载前、加载中和加载后。较佳地,所述的获取HTTP响应内容数据,通过HTTP响应头(ResponseHeaders)中的Content-Type获取当前页面内容的MIME(MultipurposeInternetMailExtensions)类型,从中过滤筛选出HTML和css格式的数据。较佳地,所述的对HTTP响应内容数据进行解析,通过对css类型的页面数据进行解析,获取页面内容显示的文本属性信息,通过对HTML类型的页面数据进行解析,获取页面文档中的文本内容信息。较佳地,所述的对HTML类型的页面数据进行解析,具体方式包括非结构化内容解析、基于DOM(DocumentObjectModel)节点解析和基于分块内容解析。较佳地,所述的获取页面内容显示的文本属性信息,具体为:遍历HTML节点,根据HML标签内容,判断是否为文本信息;若包含文本信息,则查看标签中css样式信息;查看css样式中是否包含font-family属性,并读取用于页面显示的字体类型和字体大小属性信息。较佳地,所述的通过修改页面内容数据嵌入水印信息,具体为:Step1,生成水印信息位串;Step2,解析页面请求的session数据包获取属性信息,并根据属性确定需要修改的HTML和css文件;Step3,遍历html和css文件内容信息,查找font-family和font属性,并进行水印字体替换后保存覆盖截获的session数据包;Step4,遍历页面HTML的标签对象获取页面显示的文本信息,并通过水印字符替换嵌入水印信息;Step5,将嵌入水印后的HTML页面文件替换原始文件,并最终更新数据包。基于同一专利技术构思,本专利技术还提供了一种网页文档水印嵌入装置,包括:数据包截获模块:负责在用户登录网络浏览器访问web应用系统页面时,通过数据拦截方式截获Web应用的HTTP协议数据包;数据包解析模块:负责对数据包截获模块获取的HTTP协议数据包中的HTTP响应头数据包进行解析,获取HTTP响应内容数据;水印信息嵌入模块:负责对数据包解析模块获取的HTTP响应内容数据进行解析,通过修改页面内容数据嵌入水印信息;浏览器处理模块:负责将水印信息嵌入模块处理后的页面文件进行正常的页面内容解析和页面内容渲染。本专利技术的有益效果如下:由于本专利技术中,在Web应用系统显示的页面文档中嵌入了文本溯源追踪信息,比如阅读者的指纹信息和时间信息等。当终端屏幕中的网页文档敏感信息被阅读者通过屏幕拷贝、屏幕录制、屏幕截屏或者屏幕外部的手机/相机拍照、录像等本文档来自技高网
...

【技术保护点】
1.一种网页文档水印嵌入方法,其特征在于,包括以下步骤:用户登录网络浏览器访问Web应用系统页面时,通过数据拦截方式截获Web应用的HTTP协议数据包;对截获到的HTTP协议数据包中的HTTP响应头数据包进行解析,获取HTTP响应内容数据;对HTTP响应内容数据进行解析,通过修改页面内容数据嵌入水印信息;将嵌入水印后的页面文件返回给网络浏览器进行正常的页面内容解析和页面内容渲染。

【技术特征摘要】
1.一种网页文档水印嵌入方法,其特征在于,包括以下步骤:用户登录网络浏览器访问Web应用系统页面时,通过数据拦截方式截获Web应用的HTTP协议数据包;对截获到的HTTP协议数据包中的HTTP响应头数据包进行解析,获取HTTP响应内容数据;对HTTP响应内容数据进行解析,通过修改页面内容数据嵌入水印信息;将嵌入水印后的页面文件返回给网络浏览器进行正常的页面内容解析和页面内容渲染。2.根据权利要求1所述的方法,其特征在于,所述HTTP协议数据包包括:响应行、响应头和响应体。3.根据权利要求1所述的方法,其特征在于,所述数据拦截方式,包括客户端HOOK方式和服务器代理拦截方式。4.根据权利要求1所述的方法,其特征在于,所述数据拦截的时机按照页面载入的过程分为页面加载前、加载中和加载后。5.根据权利要求1所述的方法,其特征在于,所述获取HTTP响应内容数据,是通过HTTP响应头中的Content-Type获取当前页面内容的MIME类型,从中过滤筛选出HTML和css格式的数据。6.根据权利要求1所述的方法,其特征在于,所述对HTTP响应内容数据进行解析,是通过对css类型的页面数据解析,获取页面内容显示的文本属性信息;通过对HTML类型的页面数据进行解析,获取页面文档的文本内容信息。7.根据权利要求6所述的方法,其特征在于,所述对HTML类型的页面数据进行解析,包括:非结构化内容解析、基于DOM节点解析和基于分块内容解析。8.根...

【专利技术属性】
技术研发人员:李晓妮
申请(专利权)人:李晓妮
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1